Понедельник, 19.02.2018
Мой сайт
Меню сайта
Категории раздела
Мои статьи [4]
Программирование [11]
Программирование и все что с этим связано
Заправка и ремонт принтеров [1]
Заправка и ремонт принтеров Делимся опытом
NoWork [3]
Наш опрос
Оцените мой сайт
Всего ответов: 13
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Форма входа
Главная » Статьи » Мои статьи

Модели агрегации информации
Проблему сбора информации из различных источников веб-разработчики пытаются решить уже давно. Одним из первых появившихся способов был так называемый screen scraping – заключается в том, что анализируется конечный HTML документ с целью получения полезной информации – статей, новостных сообщений и другой информации. Такой способ добывания информации, естественно, используется вне зависимо от желания создателя страницы и поэтому нежелателен для применения. К тому же, при высокой динамичности страницы необходимо постоянно следить за изменением ее содержания, что очень трудоемко [1].
Тем не менее, одной из наиболее ярких тенденций развития сегодняшнего Интернета является агрегация информации различного рода с целью получения и предоставления новых типов услуг - например, уже широко распространенные сервисы, позволяющие сравнивать цены в различных интернет – магазинах. Например, сайт ChicagoCrime.org – на этом ресурсе вы можете найти информацию, полученную от чикагской полиции о происшествиях, которые локализованы на карте Google Map [23].
В сфере агрегации новостей наиболее распространенным форматом представления информации является RSS — семейство XML-форматов, предназначенных для описания лент новостей, анонсов статей, изменений в блогах и т. п. Информация из различных источников, представленная в формате RSS, может быть собрана, обработана и представлена пользователю в удобном для него виде специальными программами-агрегаторами. Он был создан в 1997 году компанией Netscape для наполнения каналов своего портала Netcenter. Вскоре эта технология уже использовалась для трансляции контента на многих новостных сайтах — в том числе таких, как BBC, CNET, CNN, Disney, Forbes, Wired, Red Herring, Slashdot, ZDNet и многих других. Существует несколько версий этого формата; сегодня все агрегаторы поддерживают все версии.
Спустя некоторое время после появления этого формата был создан его аналог, призванный устранить недостатки и заменить RSS – формат Atom. Не смотря на все усилия его разработчиков, формат не смог вытеснить своего конкурента, и теперь оба используются для создания новостных лент. Формат RSS все же остается более популярным, не смотря на наличие некоторых недостатков - из-за существования нескольких различных версий формата RSS-каналов программы - агрегаторы должны уметь работать со всеми вариантами, что создаёт некоторые трудности их разработчикам [24].
Основными преимуществами формата RSS является неперегруженность излишними операторами и динамичность обновлений – для их получения не нужно запрашивать информацию с сайта – это происходит автоматически.
Таким образом, в данном дипломном проекте информация будет агрегироваться посредством RSS – каналов
Категория: Мои статьи | Добавил: neon (16.03.2011)
Просмотров: 420 | Комментарии: 1 | Рейтинг: 5.0/1
Всего комментариев: 0
Имя *:
Email *:
Код *:
Поиск
Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Copyright MyCorp © 2018
    Конструктор сайтов - uCoz