Как избежать неинформативности
Таинственные, темные, скрытые, невидимые - так можно назвать части Всемирной паутины, которые недоступны поисковым паукам, и поэтому не могут быть проиндексированы. Помимо них, в интернет-пространстве существуют еще и «серые» области информации, которые, даже будучи проиндексированными, остаются непонятными и малозначимыми для Google.
«Страницы-сироты» (от англ. «orphaned pages») являются самым распространенным примером страниц, не содержащих в себе достаточного объема информации. «Страницами-сиротами» принято называть страницы, которые не связаны с другими страницами сайта, а ссылку на них можно найти только в общих результатах поиска. В таких случаях системе Google кажется, что вы не считаете нужным показывать эту страницу посетителям и не заботитесь об увеличении ее посещаемости. Запрос к вашему серверу о страницах, не посещаемых пользователями, обозначит список потенциальных «сирот».
Такие технологии, как PDF (от англ. «Portable Document Format» - формат портативных документов) и Flash (мультимедийная платформа компании Adobe для создания веб-приложений), также могут оказаться в «серой» зоне, так как они не предоставляют подробную структурную разметку текста, как в HTML-коде. Технологии JavaScript (объектно-ориентированный скриптовый язык программирования) и методы Ajax (англ. Asynchronous Javascript and XML - подход к построению интерактивных пользовательских интерфейсов веб-приложений) могут инициировать появление новой информации в ответ на действия пользователя (как и Flash), однако следует применять эти технологии очень осторожно. В противном случае ваша страница может стать абсолютно невидимой для поисковых роботов Google.
Контент, облеченный в различные формы, также может оказаться недоступным для Googlebot. Система Google проявляет особый интерес к базам данных, потому что в них может содержаться полезная информация; однако зачастую для доступа к таким сведениям приходится заполнять поля и щелкать по кнопкам. Сотрудники компании Google работают над тем, чтобы позволить Googlebot заполнять простые формы для оценки информации, скрывающейся за ними. Зачем вам все усложнять?
Видео- и аудиоконтент, проигрываемый с помощью технологий Flash, QuickTime, МРЗ и других схожих программ, тоже представляет проблему для Google. Если вы собираетесь использовать эти технологии на своем сайте, убедитесь, что любой контент, проигрываемый с помощью таких мультимедийных форматов, имеет простой текстовый аналог.
Видео может содержать весьма полезную информацию. Результаты поиска системы Google часто включают ссылки на видео, представленные такими проверенными сервисами, как Google YouTube, Google Video и сторонними сайтами с хорошей репутацией, например Metacafe. Ссылка, содержащая видео, на странице результатов поиска отмечается изображением видеокадра, и у пользователей возникает непреодолимое желание щелкнуть по нему. Чтобы при ссылке на ваш сайт также появлялось изображение видеокадра, нужно разместить свое видео на одном из вышеперечисленных ресурсов. Пользователи при переходе по ссылке не попадут прямиком на сайт, но, в конечном итоге, размещение видео может увеличить шансы на его посещение, особенно если в видеофайле содержится ваш URL-адрес.
Если возникли проблемы
Ввод в эксплуатацию интерактивных или мультимедийных вебсайтов - это процесс, сопряженный с рисками создания помех в работе или полного блокирования программы Googlebot. Если у вас есть желание создать такой сайт, самое время прислушаться к мнению профессионалов. Некоторые простые утверждения помогут вам определить потенциально уязвимые места будущего веб-сайта:
• на вашем веб-сайте содержится текст;
• при отключении сценария JavaScript содержимое страницы, которое вы хотите сделать видимым для поисковой системы Google, остается для вас доступным;
• то же самое происходит и при отключении Flash;
• при использовании файлов PDF у вас имеется подробное их описание на связанной с ними HTML-странице;
• при щелчке, наведении указателя мыши или другом взаимодействии со страницей новый контент появляется с прежним URL-адресом.
Если вы не согласились хоть с одним утверждением, то, возможно, у вас возникнут проблемы. Если контент, который должен быть проиндексирован, доступен только через интерфейс прикладной системы, поисковая система Google его не обнаружит. Следовательно, вам потребуется разработать карту сайта - в четко выраженном HTML-коде, - которая откроет Google путь к вашим данным.
Возможно, самые серьезные проблемы возникают, когда навигация по сайту осуществляется при помощи технологий, отличных от HTML-кода, а ссылки к контенту этого сайта за его пределами не работают. Если что-либо из вышеперечисленного соответствует устройству вашего сайта, вы обнаружите, что огромное число ссылок к географическим точкам на вашем сайте Google просто не видит.
Случай из нашей практики
Одна из крупнейших фирм по торговле недвижимостью обратилась в компанию Google с просьбой увеличить производительность их веб-сайта. Сотрудники этой компании предоставили целый ряд ссылок, доступных программе Googlebot, для привязывания объектов недвижимости к определенному местоположению. Однако Google индексировала лишь незначительную долю всех объектов недвижимости. Мы определили, что список объектов в любой из географических точек был сведен к группам из десяти единиц. Чтобы перейти к следующей странице, пользователям приходилось щелкать по цифрам, обозначающим страницы, например «2», чтобы перейти ко второй странице, «3» - к третьей и т. д. Ссылки ко всем последующим страницам могли осуществляться только с помощью технологий JavaScript. Без их применения лишь первые десять объектов недвижимости попадали в поле зрения программы Googlebot и могли быть проиндексированы. В этом и заключалась проблема, которую наша компания успешно разрешила.
Как заработать хорошую репутацию
Существует направление технического руководства, которое отличается от темы структурирования Видимости, описываемой в предыдущей главе, но является жизненно важным в процессе адаптации вашего сайта для поисковой системы Google. Это направление работает с репутацией веб-сайта. Вам следует удостовериться в том, что ваш сайт на хорошем счету в поисковой системе Google.