Поиск информации в сети Интернет (№18)

ОГЭ по информатике

Теория

Ключевые слова — это слова, которые представляют содержание текста. Как правило, результаты поиска сортируются: страницы, которые лучше всего (по мнению поисковой системы) соответствуют запросу, будут показаны первыми.

Каталоги и поисковые системы
Очень важную роль в Интернете играют специальные сайты, предназначенные только для поиска информации. Выделяют два типа таких сайтов: каталоги и поисковые системы. Каталоги — это сайты, содержащие список ссылок на другие сайты с кратким описанием. Каталоги составляются вручную людьми-экспертами. Все ссылки сгруппированы по разделам, в разделах есть подразделы и т.д. На рисунке показана одна из страниц Яндекс-каталога:

Первый всемирно известный каталог был создан компанией Yahoo! в 1995 году. Открытый каталог, также известный под именем DMOZ, поддерживается интернет-сообществом добровольных редакторов. Поскольку большинство каталогов составляются вручную, они содержат не так много ссылок (ведь в Интернете миллионы сайтов!). Однако ценность и авторитетность этих ссылок достаточно высока, потому что качество информации на сайтах оценивают эксперты, обладающие большими знаниями каждый в своей области.

Второй тип сайтов для поиска информации — поисковые системы — работают в автоматическом режиме.
Поисковые системы — это сайты для поиска информации в Интернете по запросам пользователей. Работу поисковой системы обеспечивает специальное программное обеспечение — поисковая машина. Поисковая машина 24 часа в сутки ищет новые сайты и новую информацию на известных сайтах Интернета. Оформление веб-страниц удаляется, а их текст (в сокращенном виде) записывается в базу данных, которая потом используется для поиска.

Как составить запрос? Простейший запрос для поисковой системы — это просто перечисление ключевых слов. Любая поисковая система сначала выдает страницы, которые лучше всего соответствуют введенным ключевым словам. Ключевые слова — это чаще всего существительные и прилагательные. Местоимения, союзы, предлоги — это так называемые “стоп-слова”, которые ничего не говорят о содержании текста, и их не включают в набор ключевых слов.

Поисковые системы становятся все более “сообразительными” и даже учатся отвечать на вопросы, введенные на естественном языке. Например, попробуйте набрать в любой поисковой системе запрос “Когда родился Пушкин?”. В современных браузерах можно вводить запрос прямо в адресной строке, там, где обычно вводят адрес сайта или веб-страницы. Браузер сам “соображает”, что строка, которая не похожа на адрес сайта, — это поисковый запрос, и направляет его поисковой системе, которая выбрана в настройках.

Достоверность информации в Интернете
Нужно понимать, что информация, размещенная в Интернете, не всегда достоверна. Каждый может создать свой сайт и написать на нем все, что угодно. В отличие от научных книг и журналов статьи в Интернете никем не проверяются (не рецензируются), поэтому истинность информации остается целиком на совести автора. Вообще говоря, проверить достоверность информации в Интернете очень сложно. Хорошо, если она найдена на официальном сайте какой-либо организации, например, правительства страны или города, фирмы, учебного заведения. Такие организации дорожат своим авторитетом, но даже на этих сайтах могут встречаться ошибки.

Обычно информация о принадлежности сайта указана в нижней части страниц сайта (она называется “подвал”) или в разделе “Контакты”. Сайты средств массовой информации (СМИ) должны указывать номер свидетельства о регистра- ции. За публикацию ложных сведений СМИ могут быть лишены лицензии, поэтому редакторы сайтов строго следят за правильностью информации. Можно поискать на других сайтах похожую информацию (не скопированную слово в слово, а с тем же содержанием).

Очень хорошо, если удалось подтвердить полученные данные печатными источниками — материалами учебников, книг, научных статей. Стоит проверить, считается ли автор материала хорошим специалистом в той области, о которой пишет. Можно доверять автору, который имеет ученую степень, например, кандидата или доктора наук. Статьи с орфографическими ошибками явно не заслуживают доверия.

Для оценки достоверности информации важна авторитетность сайта — как часто на него ссылаются с других сайтов, какой рейтинг у сайта в поисковых системах (появляется ли ссылка на сайт на первой странице с результатами поиска или на 31-й). Известные сайты обычно дорожат своим авторитетом. Отметим, что алгоритмы определения рейтинга сайта в поисковых системах обычно содержатся в тайне. Можно только сказать, что рейтинг повышается, если сайт часто обновляется и на нем публикуются новые оригинальные материалы, которые не встречаются на других сайтах.

(автор текста - Поляков К.Ю., иллюстрации - Рассыхаев А.А.)

Примеры решения задач

При решении задач на определение количества найденных по запросу страниц удобно использовать круги Эйлера:

  • операция & (И) - пересечение областей, означает что веб-страница одновременно содержит слова А и В;
  • операция | (ИЛИ) - сложение областей, веб-страница содержит слово А, или слово В, или оба слова одновременно.

 

Пример 1.
В таблице приведены запросы к поисковому серверу. Для обозначения логической операции ИЛИ в запросах используется символ |, а для логической операции И – символ &.

Расположите номера запросов в порядке убывания количества страниц.

Решение:
Изобразим графически запросы:

Видно, что больше всего страниц найдется по запросу 1, меньше всего по запросу 2

Ответ: 1341

 

Пример 2.

Приведены запросы к поисковому серверу. Для каждого запроса указан его код – соответствующая буква от А до Г. Запишите в таблицу коды запросов слева направо в порядке возрастания количества страниц, которые нашёл поисковый сервер по каждому запросу. По всем запросам было найдено разное количество страниц.
Для обозначения логической операции «ИЛИ» в запросе используется символ «|», а для логической операции «И» – символ «&».
Код      Запрос
А          Солнце & Воздух
Б          Солнце | Воздух | Вода
В          Солнце | Воздух | Вода | Огонь
Г          Солнце | Воздух

Решение:
Изобразим графически запросы:

Ответ: 1423

Ответ запишем аккуратно, смотрим на порядок (возрастания или убывания).

 

Пример 3.
В таблице приведены запросы к поисковому серверу. Для каждого запроса указан его код – соответствующая буква от А до Г.
Расположите коды запросов в порядке возрастания количества страниц, которые нашёл поисковый сервер по каждому запросу. По всем запросам было найдено разное количество страниц.
Для обозначения логической операции «ИЛИ» в запросе используется символ «|», а для логической операции «И» – «&».

Код

Запрос

А

А. Конан Дойль & Г. Бичер-Стоу & Джером К. Джером

Б

А. Конан Дойль | Г. Бичер-Стоу | Джером К. Джером

В

А. Конан Дойль | (Г. Бичер-Стоу & Джером К. Джером)

Г

Г. Бичер-Стоу & Джером К. Джером

Решение:

Изобразим графически запросы:


Ответ: АГВБ

Пройти тест по этой теме

 

ОГЭ по информатике

blog comments powered by Disqus

Яндекс.Метрика Мой канал на youtube Усть-Куломская школа Усть-Куломский район Коноплев О.О.

© 2016 Рассыхаев А.А.