Рейтинговые книги
Читем онлайн Мониторинг информации в Интернете - А. Артемов

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 2 3 4 5 6 7 8 9

6. Заглавные и строчные буквы.

Яндекс периодически меняет некоторые нюансы в этом вопросе, стараясь, однако, придерживаться главного правила: слова, написанные с маленькой буквы, будут выдаваться и с маленькой, и с заглавной, а слова, написанные с заглавной буквы, будут выдаваться только с заглавной. Изменения, которые периодически происходят в подходах Яндекса к этой проблеме, обычно касаются попыток исправить наиболее распространенные ошибки пользователей. Ознакомиться с текущим состоянием дел можно как на странице помощи самого поисковика, так и в работе Дениса Фурсова.

Однако для эффективной работы достаточно просто следовать приведенному в этом разделе правилу.

Если же слово написано целиком заглавными буквами, Яндекс будет рассматривать его как представленное прописными. То есть, результаты ввода в поисковую строку понятия «РИТЕЙЛЕР» будут такими же, как и в том случае, если мы оформим запрос иначе – «ритейлер».

Запрос: [бухгалтерский Учет] Результат поиска: страниц – 556 606, сайтов – не менее 1984 В выдаче: … Положение по бухгалтерскому учету «Учет основных средств» ПБУ 6/01» Запрос: [бухгалтерский учет]

Результат поиска: страниц – 5 742 378, сайтов – не менее 2169 В выдаче: …постановка, восстановление и ведение бухгалтерского учета

7. Обязательное включение слов запроса в выдачу.

Чтобы искомые слова непременно присутствовали в документах к выдаче, используется оператор «плюс» (+). Для того чтобы наглядно показать работу этого оператора, сделаем запрос со словами, которые редко оказываются в одном документе. При этом разделим их пробелом.

А затем сделаем точно такой же запрос, но поставим знак «плюс» перед каждым словом, запретив тем самым Яндексу выдавать документы, в которых набор искомых терминов неполный.

Результаты отличаются разительно – вместо тридцати трех тысяч страниц в первом случае, во втором мы имеем всего восемь!

Запрос: [литейщик провизор стоматолог маркшейдер]

Результат поиска: страниц – 33 005, сайтов – не менее 1192

Запрос: [+литейщик +провизор +стоматолог +маркшейдер]

Результат поиска: страниц – 8, сайтов – не менее 4 В выдаче:

ОК 010-93: Общероссийский классификатор занятий (ОКЗ)

… 222 1 Специалисты в здравоохранении (кроме медицинских сестер) 2221 5 Врачи 2222

Стоматологи 2223 2 Ветеринары 2224 6 Фармацевты 2229 4 Специалисты-…

Образование в Кузбассе Литейщик пластмасс Литейщик цветных металлов…

№ 257 від 27/07/1995, Покажчик, Класифікатор, Держстандарт України для детского и подросткового возраста 2222.1 23667 – Научный сотрудник (стоматология) 2222.2 20459 —

Врач-стоматолог 2222.2 20462 – Врач-стоматолог… 8122.2 13382 7 Листобойщик 8122.2

13384 2 Литейщик вакуумного, центробежно-вакуумного и центробежного литья 8122.2

13388 19 Литейщик изделий из…

Оператор «плюс» бывает незаменим и в тех случаях, когда есть необходимость обязательно включить в выдачу стоп-слова.

Очень хорошо это описано в работе Дениса Фурсова.

Если какие-то слова должны быть в результатах, поставьте перед ними +'. Помогает со стоп-словами. Сейчас Яндекс, кажется, учитывает стоп-слова только в запросе из трех и менее слов (даже не операндов!). +не покупай (samsung|lg) позволит найти негативные отзывы о продукции этих фирм (сравните с простым 'не покупай (samsung|lg)). Запрос: [+не покупай (samsung | lg)] Результат поиска: страниц – 5 314, сайтов – не менее 1227

В выдаче: phorum – Основной форум – Re: ЛЮДИ, не покупайте Samsung 753 DFX в Wellcome ЛЮДИ, не покупайте Samsung 753 DFX в Wellcome новое Запрос: [не покупай (samsung | lg)]

Результат поиска: страниц – 779 096, сайтов – не менее 629

В выдаче: Купля продажа мобильных телефонов на Buy-Mobile.ru – Мобильный друг ждет!

Текст ссылок: купить lg бу дешево… купить lg или sony… Правда, Яндекс игнорирует стоп-слова как-то бессистемно. Так, запросы: [+не покупай (троллейбус | автобус)] и [не покупай (троллейбус | автобус)] – дают одинаковое количество результатов, в которых слово «не» учитывается как релевантное. Тем не менее, поскольку нет возможности проверить, как Яндекс отреагировал на запрос в каждом конкретном случае, мы рекомендуем воспользоваться советом Дениса и ставить «плюс» перед стоп-словами, как, впрочем, и перед теми словами, которые вы обязательно хотели бы видеть в выдаче.

8. Поиск точной фразы.

Не исключено, что вам понадобится найти определенную цитату либо рекламный слоган какой-либо компании. Для этого используется оператор «двойные кавычки», аналогичные тем, что применяются в прямой речи. В выдаче при поиске цитаты будут присутствовать документы, содержащие все слова искомой фразы, в той же форме и последовательности, что и в оригинальной ее версии. Важно помнить, что точной цитата будет лишь в том случае, если кроме фразы, указанной в кавычках, в запросе не будет никаких лишних слов. Если помимо фразы в кавычках появится еще хотя бы одно слово, Яндекс будет выдавать документы, которые содержат все слова цитаты, сохранит их последовательность, варьируя при этом их формы. Как следствие, количество документов в выдаче заметно возрастет. Яндекс называет это «слова идут подряд».

Запрос: [ «ты всегда думаешь о нас»]

Результат поиска: страниц – 2905, сайтов – не менее 778

В выдаче: Tefal – ты всегда думаешь о нас! Онли!!

Tefal, ты всегда думаешь о нас!

X-файлы – Тефаль, ты всегда думаешь о нас.

Тефаль, ты всегда думаешь о нас! (антиреклама 1) (Николай Якимчук) | Проза. ру…

Электронный журнал со свободной публикацией произведений. Ежедневные редакторские обзоры лучших произведений.

Интересно понаблюдать при такой слаженности результатов за тем, как работает оператор исключения слова из предложения:

Запрос: [ «ты всегда думаешь о нас» ~ (tefal | тефаль)]

Результат поиска: страниц – 307 773, сайтов – не менее 1197

В выдаче: Конференции – АвтоКазань – АвтоКазань. Ru

а я вот всегда думал (+) >> OldDaddy 20.05.2005 17:21:24

Chel.ru – Новости бизнеса. Справочник промышленных, торговых, общественных и…

Почему-то я всегда думала, что практические статьи д.б. написаны ПОНЯТНЫМ языком.

Открытки Всегда думаю о тебе!!

> Красивые фотографии, открытки > Открытки > Всегда думаю о тебе!! Я Всегда думаю о тебе!!

9. Слова находятся на определенном расстоянии.

Этот оператор очень часто используется на практике, так как позволяет достаточно четко ограничить поиск. Вид он имеет следующий: /n, где n, по определению самого Яндекса, – это «максимально допустимое расстояние между двумя любыми словами запроса».

Денис Фурсов дает такое определение оператору: «Расстояние между словами». Мы предлагаем следующим образом запомнить значение цифры в операторе: эта цифра (n) показывает, каким по счету будет второе слово после первого. Например, если в запросе написано:

[годовой /1 отчет], то в выдаче будет присутствовать фраза «годовой отчет». Потому что слово «отчет» будет первым после слова «годовой». Если в запросе написано: [годовой /2 отчет] то в выдаче может появиться «годовой финансовый отчет», потому что слово «отчет» может быть вторым после слова «годовой», а первым может быть любое другое слово.

Надеемся, мы объясняем доступно, потому что хотим рассказать еще о двух нюансах оператора расстояния между словами.

На самом деле, по запросу:

[годовой /2 отчет] документы, содержащие выражение «годовой отчет», также будут выданы, потому что меньшее значение расстояния возможно, а большее – нет. Мало того, в выдачу попадет не только сочетание «годовой отчет», но и «отчет годовой». Расстояние между словами распространяется на оба слова.

Если же есть необходимость ограничить выдачу фразой «годовой отчет», исключив из нее выражение «отчет годовой», то оператор можно написать вот так: [годовой /+1 отчет].

Это практически эквивалентно запросу: [годовой /1 отчет ~ «отчет годовой»].

Количество документов в выдаче совпадает, и в первых рядах в момент составления запроса был документ:

Годовой отчет – 2005. О книге.

Только с «Годовым отчетом – 2005» от журнала «Главбух» вы получите удобный мини-справочник по годовому отчету…

Мы не будем чрезмерно загружать читателя описанием оператора расстояния между словами, так как сказанного вполне достаточно для работы, а изучение всех нюансов функционирования поискового движка Яндекса не входит в круг основных наших задач. Чтобы увидеть разницу между наличием и отсутствием знака «плюс» в операторе расстояния между словами, проведем напоследок такой эксперимент: сначала сделаем запрос, который позволяет появиться в выдаче документам, содержащим, согласно оператору расстояния, как фразе «годовой отчет», так и «отчет годовой», при этом исключив из результатов «годовой отчет»; а затем создадим запрос, требующий, за счет написания оператора расстояния между словами, выдачи только «годового отчета», и убедимся, что при попытке исключения конкретной фразы «годовой отчет» результат получить не удастся.

1 2 3 4 5 6 7 8 9
На этой странице вы можете бесплатно читать книгу Мониторинг информации в Интернете - А. Артемов бесплатно.
Похожие на Мониторинг информации в Интернете - А. Артемов книги

Оставить комментарий