Тема: Регистрация ресурса в поисковых системах
ПЛАН ЗАНЯТИЯ
Дисциплина: ОП.13 Основы Веб-технологий
Преподаватель: Машарова Р.В.
Курс: 2
Группа: 1 ПКС-20
Специальность: Программирование в компьютерных системах
Дата: 09.06.2022
Время проведения: 08.10-09.30, 1 пара
Тема: Регистрация ресурса в поисковых системах
Цель занятия:
Дидактическая: познакомиться с регистрацией ресурса в поисковых системах
Развивающая: развивать логическое и критическое мышление, умение обобщать и синтезировать знания
Вид занятия лекция
Литература:
1. Гаврилов М.В., Информатика и информационные технологии. Учебник для прикладного бакалавриата /М.В.Гаврилов, В.А.Климов. -4-е изд., пер. и доп. – М.: Юрайт, 2014. – 383с.
2. Новожилов О.П. Информатика. Учебник для прикладного бакалавриата /О.П.Новожилов. -3-е изд., пер. и доп. – М.: Юрайт, 2014. – 619с.
3. Симонович С.В. «Основы Информатики. Базовый курс» СПб: Питер 2008 год – 640 с.
4. Храмцов П.Б., Брик С.А.,. Русак А.М., Сурин А.И., Основы web-технологий. Курс лекций. -2- е изд., пер. и доп. – Интернет-Университет Информационных Технологий, 2003. – 512 с.
Тема: Регистрация ресурса в поисковых системах.
1. Регистрация ресурса в поисковых системах.
2. Принципы работы поисковых систем
1. Регистрация ресурса в поисковых системах.
Рассмотрим процесс добавления ресурсов к базам данных поисковых систем. Прежде всего, следует помнить, что процесс регистрации не является мгновенным, поскольку после подачи заявки сайт попадает в очередь обработки, которая может растягиваться на несколько дней или недель. Чтобы поисковая машина смогла добавить созданный сайт в свою базу данных, он должен содержать определенную служебную информацию. Прежде всего, это касается определения ключевых слов и описания сайта.
Для веб-сайта хорошо подобрать около 20 ключевых слов, которые бы как можно точнее отражали его материал, цель функционирования и назначения. Стоит попытаться представить, по каким словам можно найти создан сайт в поисковой машине. Например, это может быть «домашние животные, попугай, амадин, рыбка, мышка, корм, любимец, учебный сайт, HTML» и другие. Можно также добавить информацию об авторе сайта.
Описание сайта - это информация, которая размещается в результатах поиска рядом с названием сайта. Обычно это одно, максимум два, предложения, описывающие содержание сайта. Следует сделать это описание можно информативным и не загромождать его фразами «это очень интересный сайт, который содержит много интересной и полезной информации!», Лучше сказать, что «сайт о домашних животных нашей семьи: попугайчика, амадины, рыбок». Если ресурс создан на нескольких языках, то ключевые слова и описание необходимо сделать на всех языках сайта.
Результаты поиска выводятся в соответствии с так называемого индекса релевантности. Он определяется по-разному для разных поисковых систем, поэтому одинаковые запросы на различных поисковых сайтах обычно выдают разные результаты. Однако учитывая принципы работы самых популярных поисковых систем можно рассчитывать на эффективное отражение своего сайта в их базах данных.
Релевантность - это соотношение количества слов из введенного поискового запроса к общему количеству слов на странице. Итак, лучшими считаются короткие страницы с большим числом слов с введенного запроса. Однако не все слова на странице имеют одинаковое значение для поисковой системы. Важнейшими из них являются служебные слова выделены в специальных тегах. Следует отметить, что каждая поисковая система имеет свои принципы отбора сайтов и определения релевантности, и значение отдельных тегов определяются каждой системой по-разному.
Важнейшим считается тег <TITLE>. Слова он, как правило, являются важнейшей информацией для поискового робота для поискового робота. Кроме того, именно текст с этого тега отображается рядом с названием страницы в результатах поиска, поэтому стоит сделать его достаточно информативным, чтобы он отражал суть этой страницы. Из этих же соображений не следует давать всем страницам сайта одинаковое название <TITLE>. Лучше, когда каждая страница имеет свое описание, который четко соответствует ее содержанию.
Следующими рассматриваются теги заголовков <H1> .. <H6>. Именно поэтому стоит выделять смысловые заголовки на страницах этими тегами, а не просто ответ. Если веб-дизайнера не устраивает стандартный вид заголовков на экране, можно воспользоваться каскадными таблицами стилей css.
Часто более важными словам считается альтернативный текст описания изображений <IMG ALT>. Прежде всего этот текст является полезным при поиске изображений - когда результатом поиска является не страницы сайтов, а графические элементы. Такой сервис реализуется на большинстве поисковых сайтов. Обычно их поиск происходит по альтернативным описанием.
Как уже упоминалось ранее, для каждого сайта нужно определить ключевые слова и описание. Они вводятся в специальные теги <META>. Тег <META> имеет следующую структуру:
<META камея = "название параметра" СООТЕОТ = "содержание параметра"> Итак, для ввода ключевых слов используется параметр keywords, а для описания сайта - description. Таким же способом можно вводить информацию об авторе сайта, под названием параметра author. Например, для сайта о домашних любимцев можно ввести такие мета-теги:
<META NAME = "keywords" CONTENT = "домашние животные, попугай, амадин, рыбка, мышка, корм, любимец, учебный сайт, HTML, home pet, parrot, cockatiel, amadin, finch, fish, hamster">
<META NAME = "description" CONTENT = "сайт о домашних животных нашей семьи: попугайчика, амадины, рыбок">
Заметим, что поисковые системы не умеют работать с фреймами. При прохождении программы-сборщика данные по сайтам с фреймами учитывается только главная страница, которая не содержит информации, а только разметку. Поэтому для включения сайта с фреймами к поисковой системе необходимо прописать все ключевые слова и мета-теги на главной странице.
2. Принципы работы поисковых систем
Точный принцип работы поисковых систем является коммерческой тайной, и пользователи сети не могут знать, как распределяется релевантность определенным поисковым сайтом. Однако приведенные выше принципы описания содержания сайта, помогут улучшить рейтинг сайта в результатах поиска.
Долгое время внесения определенной информации в тегах на страницы сайта было единственным способом оценки его содержания для поисковой системы. Однако, в 1998 году появился новый алгоритм расчета релевантности - PageRank или рейтинг страницы. Авторами этого подхода были создатели фирмы Google, которые предложили считать надежность представленной информации. Это означает учет гиперссылок, которые ведут на определенную страницу. Если таких ссылок много, это означает, что информация является полезной и PageRank страницы повышается. С тех пор много поисковых систем поддержали эту идею, и рядом с текстовым наполнением страницы анализируется и ее рейтинг. Сайт Google содержит рекомендации по подготовке сайта к включению в их реестр. Среди них:
• сайт должен иметь понятную структуру и исправные гиперссылки
• в тексты веб-страниц следует добавлять ключевые слова, по которым их и смогут найти пользователи поисковой системы
• все изображения должны содержать альтернативный описание
• следует заполнять мета-теги, теги названий и заголовков соответствующей И информации
• желательно, чтобы на сайте была страница, которая четко и понятно описывает И информацию, которую содержит сайт
• полезно создать карту сайта, которая содержит ссылки на все И другие страницы сайта
• если не нужно добавлять определенные страницы сайта в поисковой И системы, это следует указать в специальном файле robots.txt.
Пытаясь улучшить свой рейтинг, владельцы сайтов обращаются к сетям обмена ссылками - таким образом, на их сайт будет больше ссылок и, соответственно, улучшится PageRank. Однако это не совсем так. Сейчас поисковые системы различают качество гиперссылок. То есть, если это ссылки с уважаемого сайта, оно является ценным, чем ссылки с бесплатного хостинга. Также их алгоритмы учитывают возраст сайта - чем дольше он в сети, тем лучше у него рейтинг. Кроме того, более ценятся не взаимные гиперссылки, а односторонние. Более того, некоторые поисковые системы даже накладывают запрет на сайты, которые принимают участие в подобных схемах обмена. Поэтому стоит обмениваться гиперссылки с действительно дружественными и соответствующими ресурсами. В общем, поисковые системы постоянно совершенствуются и меняют алгоритмы своей работы.
Поскольку Интернет обновляется и меняется постоянно, в поисковых системах не всегда новейшие и полные версии страниц. Поэтому большинство поисковых сайтов позволяют добавлять веб-адреса, которые надо добавить в базу. Это не значит, что все эти адреса будут сразу добавлены, однако они обязательно будут рассмотрены при следующем прохождении программы, собирает информацию для этого ресурса.
Несколько по другому принципу функционирует добавления сайтов в полностью автоматических систем, таких как Google. На странице http://www.google.com/addurl/ надо только указать URL сайта и минимальный комментарий. Специальная программа пройдет по указанному адресу, проверит все гиперссылки сайта и внесет в систему с определенным индексом релевантности. Этот процесс является полностью автоматическим и не требует дополнительной информации от владельца ресурса. В то же время это означает, что сайт должен быть подготовленным к индексации в поисковой системе до момента внесения его адреса в такую форму, иначе его релевантность может быть случайно занижена.
Контрольные вопросы.
1. Поисковые машины. Этапы работы. Примеры.
2. Добавление ресурса в поисковые системы.