Крадецът на… URL-и
To read the article in English, click here.
За един успешен уеб-проект е важно да бъде забелязан и от търсещите машини. Оптимизирането му и поставянето му сред първите в резултатите е сигурен начин потребителите да достигат по-лесно до съдържанието, ковто предлагате. Не е случайно, че оптимизирането на сайтове за търсещи машини е една от най-важните дисциплини в спорта „Програмиране“ от години. Прилага се, за да бъдат намерени най-подходящите ключови думи, както и за да се адаптира структурата на сайта към инструментите, с които търсещите машини си служат. Допълнителна цел е и разполагането на т.нар. Backlinks (задни линкове) – линкове, които водят към Вашия уеб сайт, но са генерирани във външни сайтове.
Ако SEO се прави правилно, то тогава може да се очаква ръст в количеството посетители. Ако все пак не забелязвате растеж и дори губите трафик, значи че SEO мерките не са ефективно внедрени. Но може и да сте били жертва на кражба на URL (URL hijack) и страниците Ви да са били изтрити от индексите на търсещите машини, за които оптимизирате, скривайки сайта Ви от потенциалните посетители.
Какво представлява кражбата на URL?
Описва се като феномен, в който даден уебсайт изчезва от резултатите на търсещите машини и бива заменен от друг сайт. Другият сайт се свързва със сайта, който търсите, но през директна връзка, вместо чрез пренасочване. Например „linked-site.com” води до „yoursite.com”, но ползва пренасочване, вместо HTML тагът <а>. Пренасоченият URL изглежда като следния пример:
www.linked-site.com/redirect.php?target=www.your-site.com
Когато търсеща машина намира подобен линк, тя категоризира свързания сайт и целевия сайт като идентични, което значи, че изтрива един от двата сайта от индекса си. Машината се ориентира на базата на HTTP статус кодове, които са прикрепени към пренасочването. Докато код 301 (Moved Permanently) означава временно пренасочване, то код 302 е главната причина за кражба на URL. Някои добре изпипани сайтове лъжат търсещата машина, че целевият сайт съществува само временно, а свързаната страница е оригиналът. Така кроулърът не проверява дали сайтовете са свързани, или не. А ако така проверка не с е състои, то тогава се индексира грешната страница и рангът на първия сайт се приписва на свързания URL.
Къде се ползват пренасочваниета 301 и 302?
Съществуват много причини за пренасочването на URL. В резултат на това, постоянните пренасочвания на т.нар. “typo domains” (домейни с правописни грешки) към правилния домейн е често срещана практика. Например, ако случайно напишете “googel.com”, вместо „google.com” в лентата на Вашия браузър, все пак ще отидете на правилното място. Постоянното пренасочване на правилния адрес на началната страница също не е необичайно. Ако посетите главната страница на английската версия на Wikipedia, пишейки en.wikipedia.org, автоматично ще бъдете пренасочени към en.wikipedia.org/wiki/Main_Page. Разработчиците ползват и постоянно пренасочване, за да водят посетители към новия уеб-адрес след смяна на домейна или да свържат съдържанието на даден сайт, който вече има нов URL.
Временни пренасочвания с код 302 се ползват за да представите временно съдържание от друг URL, за да бъде все пак дадено съдържание достъпно, например когато даден сайт бива затворен за поддръжка. Ако разработчик ръчно създаде такъв тип пренасочване, намерението е това съдържание да се появи отново на оригиналния сайт, но по-късно. Но има два сценария за временно пренасочване или кражба на URL, което се практикува само заради тази цел:
Случайно полване на пренасочване с код 302: Възможно е някой разработчик без да иска да свърже 2 сайта. Може да е грешка, като целта е била да се изгради постоянно пренасочване. Машината за пренаписване на URL-и на уебсървър Apache mod_rewrite поставя пренасочвания с код 302 по подразбиране.
Динамично генерирани URL-и: PHP е широко използван програмен език от уеб разработчиците. Скриптовете на сървърите на този програмен език са лесен и практичен начин да създадете динамично съдържание за Вашия уебсайт. Но често точно PHP скриптовете са тези които интегрират динамични целеви адреси във вече съществуващ URL, чрез временния код за пренасочване 302. Този вид скриптове се използват главно в директории на уеб адресите, но и в системите за управление на съдържание (CMS).
Съзнателна кражба на URL: Киберпрестъпниците също знаят как да използват кражбата на URL-и и с радост се възползват от това. Те съзнателно ползват код 302, за да пренасочат своето съдържание, отвличайки чужд URL, и то да излезе по-напред в страниците на търсещите машини. Тази практика, разбира се, попада под ударите на закона.
Как да предпазим сайта си от URL злоупотреби?
Всеки, който е загрижен за подобряването на ранга на уебсайта си, знае колко време и усилия изисква това. Колкото по-напред е сайтът Ви в резултатите на някоя търсеща машина, толкова по-голяма е вероятността URL-ът Ви да бъде откраднат. За разлика от атаките, при които е необходим пробив в системата през дупка в сигурността, кражбата на URL по-скоро е свързана с основни SEO познания за строене на линкове и не може да бъде предотвратена с антивирусен софтуер. Много е важно редовно да анализирате както новите, така и вече съществуващите задни линкове, които да филтрират проблемните URL-и. Съществуват различни услуги и инструменти като SEMrush, LinkResearchTools, SISTRIX, или Google Search конзолата, която също може да Ви е от полза.
Гореспоменатата услуга на Google предлага инструмент за премахване на URL-и, който Ви позволява да изтриете всички нежелани пренасочвания, които се отнасят към сайта Ви, от индекса на търсене. Преди да предприемете тази стъпка, обаче, е необходимо да се свържете с разработчика си и да го помолите да настрои рутирането на сайта. По този начин задните линкове могат да бъдат поддържани. Статус кодът 307 (Temporary Redirect) вече е възможност от HTTP 1.1 насам. Той пренасочва временно, но не води до кражба на URL.
Ако оригиналният сайт вече липсва от индекса, трябва да се свържете с контактния център на търсещата машина и да помолите за възстановяване на оригиналния ранк на сайта Ви, но смед като сте открили и премахнали, или поправили сгрешения заден линк.