Differences between revisions 2 and 3
Revision 2 as of 2008-08-15 13:08:04
Size: 8967
Comment:
Revision 3 as of 2008-08-15 13:55:07
Size: 10657
Comment:
Deletions are marked like this. Additions are marked like this.
Line 24: Line 24:
Вт эти писк. и предн. для орг. индекса всех страниц интернета. С дной стороны, она неосущ., с другой, она делается в тй или иной мере. Большие поисковые системы, такие как google, и предназначенны для организации индекса "всех" страниц интернета. Задача с одной стороны абсолютно нереальная, а с другой она нереальна только с точки зрения теории, а на практике она вполне себе осуществимая, просто требуются большие мощности, постоянное пересоздание этих индексов и т.д.
Line 26: Line 26:
Проблема в том, чт никто интернет для поиска инф. не дааптировал. Н поиск инф. мжно, поск. поиск сделан до вас, вы уже плоьз. поиск. машинами, которые выд. некий результат. Надо понимать, что при этом никто и ничто не начинает искать запрос по всему интернету. Есть рботы, которые таки хдят по страницами с разл. чатстой и фрмируют индекс. Есть понятие релевантность. Универс. критерия, какой твет на поиск. запрос явл. релевантным, нет. Поск, п сути, поиск. запрс это не произв. предлож, а поиск. по базе, то все поиск. службы предст. той или иной сложности инт. по созд. сложный запрос.

Лёня Дмитриев делал доклад про инф. писк зимой в МПГУ.

Закончим двумя вещами.

Обр. внимание, сколько гугл набещал совпадений. Понятно, чт без сорт. по рел. не прсмотрите эти 64 тысячи ссылко. И если знете, что искать, то искать лучше не в гугле, а на сотв. тем. сайтах, например, по википедии.
Проблема в том, что никто интернет для поиска информации не адаптировал. Со всей очевидностью искать информацию в Интернете можно, но правильный способ - сделать так, чтобы поиск информации в интернет проделал кто-то за вас, а вы бы воспользовались поисковыми машинами, которые выдавали бы результаты.
Надо понимать, что при этом никто и никогда не принимает запрос от пользователя чтобы потом искать варианты ответа во всем интернете. Эта проблема решается примерно следующим способом - они условно занимаются "поиском всего в интернете" - есть "роботы", которые ходят по страницами с различной частотой и производят индексацию. И поисковый запрос - это запрос по индексу, и ответ на запрос - это те страницы, которые в этом индексе максимально соответствуют этому запросу. Существует такое понятие --- релевантность. Универсального критерия, какой именно ответ на поисковый запрос является наиболее релевантным нету, и алгоритм определения релевантности ответа на запрос - это одна из наиболее охраняемых тайн поисковых служб. Поскольку, по сути, поисковый запрос это не произвольное предложение, а обращение к базе с определенным сложным ключом, то все поисковые службы предоставляют той или иной сложности интерфейс по созданию сложного поискового запроса со всякими правилами.
##Скриншот
Обратите внимание, сколько ссылок было выданно в результате. Понятно, что без сорттровки по релевантности вы не прсмотрите эти 64 тысячи ссылок. И если вы знаете, что искать, то искать лучше не в поисковой машине, а на соответствующем тематическом сайте, например, на википедии.
##3:14
Line 42: Line 39:
|| 0 || 1 || 1 || 1 || || 1 || ArtemSerebriyskiy, VladimirLysikov, MaximByshevskiKonopko || || || || 10 || 1 || 1 || 1 || || 1 || ArtemSerebriyskiy, VladimirLysikov, MaximByshevskiKonopko || || ||

Firefox: продолжение

Firefox характерен тем, чт он не просто навигатор, а навигатор гибко перенастр. и дополняемый.

Одним из важных ссвойст явл. дополнения к firefox. В дистр. матер и джунир фаер сразу входит с неск. дополнениями.

Продукты линейки мзилла устр. след бразом: куск на C++? B BPV/ RECR? RJNJHSQ XFCN/ YFGBCFYJ на JavaScript (который, в числе прочего, исп. в акт. страницах), а вот формочки делаются на спец. языке описания, XUL. И т и то интерп., это не нужно кмпилирвать и сбирать. В рез-те мы получаем такой дистрибутив, в кторый мы згр. продлукт под назв. расширение, этот продукт встраивается в готовй фаерфокс и придаёт ему доп. функц. В фаер. в мастере по умолч. стоит целый ряд дополнений, и некторые из них даже плезные.

Для пльз. интересны будут итн. неск. расширений:

  • Самое простое расш., а просто доп. словарь --- прверка орф. при рботе с текстами, которые вводятся в textarea.
  • Есть менеджер сеансов, т него мы не видим ничего непоср., типа полезных кнопочек типа восст. закрытое оконо и восст. сессии после нешт. завершения
  • AdBlock Falsh block. На сегодняшний день практитка вставления всевозм. рекл. картинок в сайты очень сильно распространилась, большая часть баннеров и есть такого рода детали, берущиеся из другого места. Если вы платите за трафик, то на этих баннерах мжно съесть изрядное количеств денег. Кроме того, они бл. инф. навясчивостью. Кроме того, мгут исп. не прсто графика, а флеш, и флешплеер одно из немногих компонент ПСПО, кторая действ. несвободная, что на ней сказывается. Тем не менее, флеш --- весьма продв техн. в плне инт. возм., и тк. т него нельзя. И без AdBlock Здгы nz;tk сущ., он предн. для удаления из страниц разл. инф. рекл. характера. Как вы понимаете, нельзя один раз навсегда сост. списк всех баннеров раз и навсегда. Поэтому сущ. обн. списки, есть сайты, где эти списк публикуются. Плюс публ. их в формате adblock plus, чтобы н мг их рег. скачивать. При старте в первый раз предл. дин или неск. списков. Правильный наз. easylist, ещё один правильный списко наз. rushack

Поставим какое-нибудь расширение. При этом, ещё раз заметим, что фаерфокс это ткой дистрибутив. При этм добавление чего-то без перезапуска довольно прбл.

Пока что среди инструментов ввода не было упомянуто окно в верхнем правом углу - окошко быстрого поиска. Напомним что связность веб-страниц внутри WWW это вещь

  • достаточно иллюзорная . в том смысле что никакого непосредственного алгоритма выявить эту связанность не существует, кроме как зайти на страницу и посмотреть на ней ссылки на другие страницы
  • в общем случае не предназначенная для человека, за исключением когда создатели некой группы веб-страниц озаботились тем, чтобы страницы ссылались друг на друга.

Так что представление сети ввиде паутины оно не для человека. По настоящему навигацию без поискового сервера сделать довольно тяжело. Многие кже не запоминают адреса сайтов компаний, а прост ввоодят имя копании в поисковике, в расчете что на первом месте будет ссылка на компанию(что , в принципе не всегда так).

Когда мы говорили о том, что WWW --- большя БД, мы не акцентировали внимание на то, что обычно в БД есть поля содержащие ключ и содержащие данные. Когда мы говорим про WWW как про БД, то там есть в основном поля содержащие только данные, поскольку никто не озаботился ключами. И как производить поиск вручную , непонятно.

Большие поисковые системы, такие как google, и предназначенны для организации индекса "всех" страниц интернета. Задача с одной стороны абсолютно нереальная, а с другой она нереальна только с точки зрения теории, а на практике она вполне себе осуществимая, просто требуются большие мощности, постоянное пересоздание этих индексов и т.д.

Проблема в том, что никто интернет для поиска информации не адаптировал. Со всей очевидностью искать информацию в Интернете можно, но правильный способ - сделать так, чтобы поиск информации в интернет проделал кто-то за вас, а вы бы воспользовались поисковыми машинами, которые выдавали бы результаты. Надо понимать, что при этом никто и никогда не принимает запрос от пользователя чтобы потом искать варианты ответа во всем интернете. Эта проблема решается примерно следующим способом - они условно занимаются "поиском всего в интернете" - есть "роботы", которые ходят по страницами с различной частотой и производят индексацию. И поисковый запрос - это запрос по индексу, и ответ на запрос - это те страницы, которые в этом индексе максимально соответствуют этому запросу. Существует такое понятие --- релевантность. Универсального критерия, какой именно ответ на поисковый запрос является наиболее релевантным нету, и алгоритм определения релевантности ответа на запрос - это одна из наиболее охраняемых тайн поисковых служб. Поскольку, по сути, поисковый запрос это не произвольное предложение, а обращение к базе с определенным сложным ключом, то все поисковые службы предоставляют той или иной сложности интерфейс по созданию сложного поискового запроса со всякими правилами.

Обратите внимание, сколько ссылок было выданно в результате. Понятно, что без сорттровки по релевантности вы не прсмотрите эти 64 тысячи ссылок. И если вы знаете, что искать, то искать лучше не в поисковой машине, а на соответствующем тематическом сайте, например, на википедии.

Помимо википедии, где аккум. без всякой гарантии народное знание, есть другие ресурсы.


Сведения о ресурсах

Готовность (%)

Продолжительность (ак. ч.)

Подготовка (календ. ч.)

Полный текст (раб. д.)

Предварительные знания

Level

Maintainer

Start date

End date

10

1

1

1

1

ArtemSerebriyskiy, VladimirLysikov, MaximByshevskiKonopko


CategoryLectures CategoryPspo CategoryMpgu CategoryUneex

PspoClasses/080812/05Firefox (last edited 2008-10-09 19:13:41 by MaximByshevskiKonopko)