Статистика |
Онлайн всего: 1 Гостей: 1 Пользователей: 0 |
|
Модели агрегации информации
Проблему сбора информации из различных
источников веб-разработчики пытаются решить уже давно. Одним из первых
появившихся способов был так называемый screen scraping – заключается в
том, что анализируется конечный HTML документ с целью получения полезной
информации – статей, новостных сообщений и другой информации. Такой
способ добывания информации, естественно, используется вне зависимо от
желания создателя страницы и поэтому нежелателен для применения. К тому
же, при высокой динамичности страницы необходимо постоянно следить за
изменением ее содержания, что очень трудоемко [1]. Тем не менее,
одной из наиболее ярких тенденций развития сегодняшнего Интернета
является агрегация информации различного рода с целью получения и
предоставления новых типов услуг - например, уже широко распространенные
сервисы, позволяющие сравнивать цены в различных интернет – магазинах.
Например, сайт ChicagoCrime.org – на этом ресурсе вы можете найти
информацию, полученную от чикагской полиции о происшествиях, которые
локализованы на карте Google Map [23]. В сфере агрегации новостей
наиболее распространенным форматом представления информации является RSS
— семейство XML-форматов, предназначенных для описания лент новостей,
анонсов статей, изменений в блогах и т. п. Информация из различных
источников, представленная в формате RSS, может быть собрана, обработана
и представлена пользователю в удобном для него виде специальными
программами-агрегаторами. Он был создан в 1997 году компанией Netscape
для наполнения каналов своего портала Netcenter. Вскоре эта технология
уже использовалась для трансляции контента на многих новостных сайтах — в
том числе таких, как BBC, CNET, CNN, Disney, Forbes, Wired, Red
Herring, Slashdot, ZDNet и многих других. Существует несколько версий
этого формата; сегодня все агрегаторы поддерживают все версии. Спустя
некоторое время после появления этого формата был создан его аналог,
призванный устранить недостатки и заменить RSS – формат Atom. Не смотря
на все усилия его разработчиков, формат не смог вытеснить своего
конкурента, и теперь оба используются для создания новостных лент.
Формат RSS все же остается более популярным, не смотря на наличие
некоторых недостатков - из-за существования нескольких различных версий
формата RSS-каналов программы - агрегаторы должны уметь работать со
всеми вариантами, что создаёт некоторые трудности их разработчикам [24]. Основными
преимуществами формата RSS является неперегруженность излишними
операторами и динамичность обновлений – для их получения не нужно
запрашивать информацию с сайта – это происходит автоматически. Таким образом, в данном дипломном проекте информация будет агрегироваться посредством RSS – каналов
|
Категория: Мои статьи | Добавил: neon (16.03.2011)
|
Просмотров: 684 | Комментарии: 1
| Рейтинг: 5.0/1 |
|
|
|