[Форум Rossia.org] [Ответы и комментарии] [Написать ответ]
Отправлено
soul 19:53:33 20/05/2000:
Белые пятна на карте Сети Составленная учеными «структурная карта» всемирной компьютерной сети WWW доказывает существование в Интернете значительного числа «белых пятен». Результаты исследования, проведенного специалистами компаний IBM, Compaq и AltaVista, будут представлены широкой публике на следующей неделе в ходе 9-й международной конференции World Wide Web Conference и конференции ACM PODS 2000. В ходе исследования ученым удалось опровергнуть распространенное заблуждение, что Всемирная Паутина общедоступна и наполнена взаимно пересекающимися ссылками. Для этого в мае и в октябре 1999 года с помощью поискового механизма AltaVista было обследовано более 200 млн веб-страниц, содержащих более 1,5 млрд гипертекстовых ссылок. Исследуемый сегмент представляет собой всего лишь незначительную часть предположительно содержащегося в WWW миллиарда веб-страниц. В результате анализа полученной информации ученым удалось разделить все содержимое Всемирной Паутины на несколько основных разделов: Центральное ядро (около 30% от общего числа веб-страниц). В состав ядра Сети входят страницы, связанные между собой гипертекстовыми ссылками настолько прочно, что пользователь может перемещаться со страницы на страницу, пользуясь только этими ссылками. Примерами таких основных страниц Сети могут служить страницы ibm.com или msnbc.com. Еще 24% Сети составляют страницы, непосредственно окружающие Центральное Ядро. Размещенные на них гиперссылки позволяют пользователю проникнуть на страницы Ядра, однако на сами эти страницы из Основного Ядра ссылок нет. Примером страницы такого типа может являться страница о вашем домашнем любимце, содержащая ссылки на интернет-магазины товаров для животных. Еще 24% Сети составляют страницы, на которые можно попасть, следуя гиперссылкам из Основного Ядра, но которые не отсылают пользователя обратно к Ядру. Примером являются страницы рефератов или научных отчетов, размещенные в недрах университетских или корпоративных веб-сайтов (типа IBM.com/research/projects/almaden... и т.д.). Еще 22% веб-страниц полностью оторваны от общей Сети. Это страницы-"глухари", на которые пользователь никогда не попадет, если только не знает их адреса заранее. Ни один поисковый механизм не способен вести поиск по таким страницам, если только они когда-то в прошлом не содержали ссылок на основную часть Сети. Такие страницы делятся на несколько категорий: они могут быть связаны гиперсылками между собой, образуя своеобразные «острова» (например, семейные веб-страницы, содержащие гиперссылки только друг на друга), могут представлять собою «трубы», т.е. страницы, направляющие пользователя от только одной страницы к следующей и обратно, или «тупики», снабженные перекрестными ссылками только внутри определенной категории. Кроме того, ученые определили, что процентное соотношение этих четырех основных категорий веб-страниц сохранилось практически неизменным в промежутке с мая по октябрь 1999 года, хотя их количество за тот же период существенно увеличилось. Ранние исследования топологического устройства Сети позволяли предположить, что «расстояние» между любыми двумя произвольно выбранными страницами Интернета составляет примерно 19 кликов. Данные нового исследования убедительно доказывают существование крупных сегментов Сети, которые вовсе не могут быть охвачены с помощью такого способа передвижения. Зачастую также расстояние между двумя отдельными страницами исчисляется несколькими сотнями кликов. Ученые утверждают, что при произвольном выборе двух веб-страниц «в 75% случаев добраться с одной из них на другую вовсе не представляется возможным». Если же такой путь все-таки существует, то среднее число кликов, из которых он состоит 16.
Ответы и комментарии: