Организация мировой информации

Опубликовал: Friday, September 16, 2024 в категории Поисковые системы | Пока нет комментариев

Стремление компании Google предоставить людям всего мира бесплатный доступ к информации поражает своим масштабом. При этом создается ощущение, что это именно то, что компания Google пытается сделать, хотя и достаточно медленно, например, в таких областях, как сканирование книг. Компания Google разрабатывает и приобретает все больше и больше сервисов, позволяющих структурировать информацию, при этом предполагается, что когда информация будет структурирована, компания на правах рекламы перейдет в статус добровольного партнера, и за это она готова заплатить.

В список текущих сервисов Google, направленных на структурирование и поиск информации, входят:

• поиск в Интернете;

• поиск изображений;

• поиск в блогах;

• поиск новостей;

• поиск видео (сервисы Google Video и YouTube);

• поиск по карте (сервис Google Планета Земля);

• поиск покупок (в торговых или предоставленных базах данных);

• поиск книг (фактически по сканированным версиям печатных изданий книг);

• поиск Goggles (в котором в качестве поискового запроса используется распознанное изображение);

• почта (включая поиск и рекламные объявления);

• документы (включая обработку текста, календарь, электронные таблицы и т. п.);

• программа Picasa (с помощью которой можно упорядочивать фотографии, размещать их в специальных электронных онлайновых альбомах, выкладывать и хранить их);

• инструмент Analytics (сервис, позволяющий анализировать трафик на веб-сайт);

• чат Talk (программа для быстрого обмена письменными и голосовыми сообщениями);

• Orkut (социальная сеть);

• группы (форумы);

• каталог (структурирует список веб-сайтов, основываясь на каталоге интернет-ресурсов Open Directory Project);

• сервис Base позволяет пользователям выкладывать любую информацию непосредственно в сервисы Google;

• сервис Desktop (версия поискового программного обеспечения Google, позволяющая осуществить поиск по вашему компьютеру);

• переводчик (языковые сервисы для перевода закачанного контента или веб-страниц);

• браузер Chrome (интернет-браузер, как Firefox или Internet Explorer);

• сервис Blogger (сервис создания блогов и хостинговый сервис);

• платформа Android (операционная система для мобильных телефонов);

• сервис Checkout (сервис, обеспечивающий безопасность онлайновых платежей);

• инструменты Search Appliance (поисковое программное обеспечение для вашего сайта, то есть исходная бизнес-модель).

Список этих сервисов постоянно увеличивается, но основная деятельность и, как следствие, источник дохода компании Google - поиск в Интернете, который и находится в центре внимания данной книги. Именно эта сфера деятельности позволяет пользователям на себе почувствовать эффективность компании Google на пути структурирования мировой информации. Также в рамках именно этой сферы проводится основная часть работы, направленной на оценку полезности найденных в Интернете данных.

При этом Google отнюдь не является жертвой собственного успеха, однако масштаб ее деятельности приводит к тому, что каждый неэтичный бизнес на планете пытается с ее помощью привлечь клиентов. Любой малейший блок поисковых запросов, совершаемых пользователями (а в октябре 2008 года только в США их было восемь миллиардов), провоцирует на проявление активности тех, кто не прочь нарушить правила. Как следствие компания Google вынуждена вкладывать все больше и больше средств в деятельность и технологии, направленные на сокращение риска отображения сайтов таких недобросовестных дельцов. Эти технологии постоянно совершенствуются, но по-прежнему основываются на базовом для поисковой системы Google принципе оценки найденной в Интернете информации и ее потенциальной полезности для пользователей. Google постоянно отслеживает сайты, пытающиеся обманным путем подняться в списке результатов, и позволяет надежным сайтам с хорошей репутацией проявить себя.

Исходя из этого, принцип упорядочивания сайтов в Google обладает двумя основными функциями:

1. Индексирование: определение типов найденной информации, ее анализ с целью установления, о чем эта информация, и создание доступной для поиска базы данных, чтобы пользователи могли находить в ней эти подробности.

2. Аутентификация: оценка релевантности информации, внесенной в индекс поисковой системы; при этом в качестве критерия оценки выступают отзывы и качество ссылок на каждый фрагмент информации.

Этот процесс индексирования и аутентификации составляет ядро поиска Google в Интернете и часто распространяется на многие другие сервисы от компании Google. Отлаженность процесса в Google и составляет ядро ее успеха; чем лучше она понимает степень полезности найденной информации, тем лучше будут результаты поиска и тем довольнее будут пользователи. В следующей главе рабочие процессы поисковой системы Google будут рассмотрены подробнее; на данном этапе этой информации достаточно, чтобы по достоинству оценить стремление компании Google к получению качественных результатов, и в этом ей нет равных. В ту минуту, когда Google пожертвует степенью релевантности результатов поиска к потребностям пользователей, она откроет двери конкурентам.

Релевантность результатов поисковой системы Google - это то, что заставляет их каждый день возвращаться на портал, и это, в сочетании с эффективностью системы отображения релевантных рекламных объявлений, означает, что именно релевантность способствует деловому процветанию Google. Осознание того, как трудно поисковой системе Google производить оценку релевантности и полезности интернет-контента - важный шаг на пути к пониманию условий, необходимых для создания веб-сайтов, максимально совместимых с ее усилиями. И ничто не демонстрирует глубину этих усилий больше, чем феномен «длинного хвоста» поиска. Компания Google не очень распространяется на тему того, сколько именно страниц находится в ее поисковой базе данных, но, по слухам, оно приблизительно равно 100 миллиардам уникальных страниц. Честно говоря, само число не имеет особой значимости, поскольку такой объем информации обработать невозможно. Однако в задачу поисковой системы Google входит соединение этих страниц с сотнями миллионов поисковых запросов, которые пользователи каждый день вводят в строке поиска.

Большинство людей думают, что поисковые запросы состоят из предсказуемых потребностей: «авиабилеты в Париж», «дешевые жидкокристаллические телевизоры», «кинотеатры в Москве», «серии фильма «Доктор Хауз», «средства от похмелья» и т. д. К чему они не готовы, так это к тому, что каждый день 20% запросов печатаются в поисковой строке портала Google ВПЕРВЫЕ. Впервые! Именно так: если условно предположить, что каждый день в строке Google вводится 100 различных запросов, то 20 из них - абсолютно новы для Google. И, вероятно, большую часть из этих 20 запросов никто никогда не введет в поисковой строке Google снова.

Этот невероятно огромный поток запросов является широким окном в души людей - журналист Джон Бэттелл (John Batteile) сравнил его с базой намерений - и представляет собой такой длинный и постоянно меняющийся список потребностей, что только сложное техническое чудо могло бы попытаться извлечь из него какую-нибудь пользу. Варьирование относительных объемов в пределах данного окна, если расположить их на шкале по объему, создает так называемую кривую «длинного хвоста». На ней, несмотря на отображенные в «голове» кривой огромные объемы поисковых запросов о действительно популярных вещах, например «ipod», «twitter» и «обама», основной объем приходится на «хвост». Поисковые запросы, попавшие в «хвост» кривой, обладают относительно низкими объемами в любом промежутке времени, но длина «хвоста» - практически бесконечное разнообразие запросов в поисковой системы Google - в конечном итоге гораздо объемнее, чем популярные темы, которые находятся в «голове» кривой.

Чем дальше продвигаешься вдоль этой кривой, тем более изощренными и специфическими становятся поисковые запросы. Вы можете спросить, что собой представляет поисковый запрос, находящийся в «хвосте» кривой поиска? Как вам: «лучшие антивирусные решения для маленьких компаний», «в каком возрасте мальчику лучше начать заниматься балетом», «морозильные камеры серебряного цвета шириной 48 см», «квартиры в США с видом на реку и поле для гольфа» и «сельскохозяйственная конференция в Шотландии, Великобритания, в апреле 2009». Хотя, возможно, конкретно эти примеры вам покажутся незнакомыми, их форма, безусловно, известна. Каждый человек в определенный момент осуществляет поисковый запрос из «хвоста» кривой, поскольку людей часто интересуют довольно специфические вещи, а чем более детализированный запрос они делают, тем более успешными оказываются их попытки (в целом). Вероятно, для вас также не окажется сюрпризом то, что чем более конкретные запросы делают пользователи - и, следовательно, чем больше они конкретизируют свои потребности - тем более вероятно, что они купят что-либо на сайтах, куда их отправляет поисковая система Google.

Проводимое компанией Google упорядочивание мировой информации - это компьютерная задача невиданного прежде масштаба: сотни миллиардов страниц информации в режиме реального времени соотносятся с миллионами уникальных поисковых запросов, чтобы результат был максимально полезным.


Похожие посты:

Комментировать

Your email address will not be published. Required fields are marked *