скачать рефераты
  RSS    

Меню

Быстрый поиск

скачать рефераты

скачать рефератыРеферат: Iнструментальнi засоби пошуку iнформацii в Iнтернет

Реферат: Iнструментальнi засоби пошуку iнформацii в Iнтернет

ЗМІСТ

ВСТУП

1. ТЕХНОЛОГІЯ ПОШУКУ ІНФОРМАЦІЇ В ІНТЕРНЕТ

1.1 Пошукові служби

1.2 Що таке пошукові індекси і каталоги

1.3 Індекси

1.4 Укладачі каталогів

2. ПОПУЛЯРНІ ПОШУКОВІ СЛУЖБИ

2.1 Тематичні каталоги

2.2 Роботи індексів або пошукові машини

2.3 Системи мета-пошуку

2.4 Системи пошуку в конференціях Usenet

2.5 Служби пошуку людей

3. ПРИЙОМИ ЕФЕКТИВНОГО ПОШУКУ

3.1 Практичні аспекти використання пошукових сервісів Інтернет

3.2 Складання посилання з імені організації

3.3 Знаходження інформації із застосуванням серверів глобального пошуку

3.4 Знаходження інформаційних ресурсів у каталогах

3.5 Зіставлення пошукових серверів і каталогів

ВИСНОВОК

ЛІТЕРАТУРА


ВСТУП

Сьогодні щодня безліч людей несподівано відкриває для себе існування глобальних комп'ютерних мереж, об'єднуючих комп'ютери у всьому світі в єдиному інформаційному просторі, ім'я якому - Інтернет. Інтернет багатогранний і не можна чітко визначити, що це таке. З технічної точки зору, Інтернет - об'єднання транснаціональних комп'ютерних мереж, що працюють з найрізноманітніших протоколами, зв'язують всілякі типи комп'ютерів, фізично передають дані по телефонним проводам і оптоволокну, через супутники і радіомодеми. Сьогодні практично будь-яка людина, що володіє доступом до комп'ютера з найпростішим модемом, може використовувати у своїй діяльності величезні інформаційні ресурси, що надаються Інтернет.

Отже, Інтернет - мережа мереж, всесвітня комп'ютерна мережа. Інтернет можна розглядати з багатьох позицій, ось дві крайні з них. Найбільш вузьке розгляд - об'єднання мереж, пов'язаних між собою так, що в будь-який момент кожен комп'ютер в Інтернет "бачить" кожен інший (тобто може передати йому пакет даних і отримати відповідь за частки секунди). Найбільш широке - кіберпростір, що народжує кіберкультуру зі своїм образом думки, своєю мовою, своєю етикою.

Інтернет чудовий тим, що мережа і її сервіси стали широко поширені у житті суспільства, що вони виявилися досить гарні, щоб ріка інформації потекла руслом Інтернет. Інтернет не вирішив проблему зберігання та впорядкування інформації, але вирішив проблему її передачі - дав можливість отримати будь-яку інформацію де завгодно, коли завгодно.

Ця чудова здатність передачі інформації призвела до грандіозних темпами зростання Інтернет. Внаслідок децентрализованности, не можна точно сказати, які його розміри сьогодні, але за оцінками "Network Wizards", кількість комп'ютерів, підключених повноцінно в Інтернет, останні два роки щорічно подвоюється, складаючи 6600 тисяч комп'ютерів в липні 1995 року. За іншими оцінками, кількість комп'ютерів, що мають доступ до будь-яких сервісів Інтернет, навесні 1995 року становило до 30 мільйонів. Це означає, що якщо швидкість росту Інтернет залишиться на тому ж рівні, то протягом найближчих років Інтернет і його сервіси стануть настільки ж загальновживаними, як телефон і телебачення сьогодні. Дуже багато компаній розуміють це, і, прагнучи першими прийти на цей ринок (а Інтернет являє собою, крім усього іншого, ще і величезний ринок мільйонів потенційних клієнтів), вкладають гроші в розвиток мережі і сервісів, їй надаються. Якщо в 1994 році в компанії, що працюють з Інтернет, було вкладено 42 мільйони доларів США, то вже за перший квартал 1995 року ця цифра становила 47 мільйонів (New York Times, 26 June 1995, p. D5). А гроші, як відомо, роблять гроші, і це є ще одним фактором, який пришвидшує розвиток мережі. Комерціалізація Інтернет - це, можливо, найважливіший аспект його розвитку сьогодні. Довгий час, до весни 1995 року, основні канали зв'язку і адміністративні структури Інтернет фінансувалися Національним науковим фондом США, але тепер фінансування припинено і розвиток мережі відбувається на комерційній основі. Щоб жити в місті, потрібно вміти користуватися транспортом. Для кожної поїздки обирають свій вид транспорту. За місто їздять на електричках, в аеропорт можна поїхати на маршрутному таксі, до метро можна доїхати на тролейбусі. Інтернет у цьому плані дуже схожий на місто. Щоб успішно працювати з ним, потрібно знати правила поведінки в мережі і вміти орієнтуватися в безлічі доступних Вам інформаційних сервісів. На жаль, зважаючи на децентрализованности і молодості Інтернет, не існує єдиної його карти або путівника по всіх його сервісів. Ефективність роботи в мережі визначається знанням існуючих сервісів, умінням працювати з конкретними сервісами і здатністю вибрати правильний спосіб вирішення конкретної задачі. Цим визначається не тільки те, як скоро можна знайти потрібну інформацію, а й те, чи можна її знайти взагалі.


1. ТЕХНОЛОГІЯ ПОШУКУ ІНФОРМАЦІЇ В ІНТЕРНЕТ

Сьогодні Інтернет об'єднує безліч різних мереж, мільйони комп'ютерів, близько 300 мільйонів користувачів (дані від Robert Orenstein) усіх континентів і, за різними оцінками, кількість таких користувачів збільшується на 15-80% щорічно. Можна виділити два основних напрямки у використанні Інтернет у бізнесі. Це оперативний доступ до воістину безмежним джерелом інформації з будь-якої тематики (на сотнях тисяч інформаційних серверів), пошук і інтерактивне спілкування з партнерами, практично в будь-якої спеціалізації та географічному розташуванні. Як зорієнтуватися у такому масштабному інформаційному просторі? Для цього існують спеціалізовані пошукові сервери. Їх можна розділити на тематичні каталоги, роботи індексів (пошукові машини), системи мета-пошуку. Також, для пошуку необхідної інформації в Інтернет вельми корисні системи пошуку в конференціях Usenet та служби пошуку людей.

Стандартна технологія пошуку інформації, реалізована, наприклад, в протоколі Gopher, грунтується на "деревах". Прикладом реалізації цієї технології можуть бути також індексні файли систем управління базами даних - "бінарні дерева". У тих випадках, коли пошук здійснюється автоматично на основі суворого алгоритму вибору подальшого шляху пошуку, технологія, заснована на "деревах" забезпечує найкращі результати. Але в тих випадках, коли вибір здійснює людина, не зовсім ясно представляє що він шукає, такий спосіб пошуку часто буде приводити в тупики тобто до інформації не повною або взагалі в даний момент не потрібною. У таких випадках пошук доводиться починати спочатку.

Основна ідея, реалізована в технології WWW (World Wide Web), полягає в тому, щоб кожний об'єкт пошуку мав посилання на асоціативно пов'язані з ним об'єкти. Причому в мережі Internet такі посилання може визначати будь-який користувач мережі. У цьому випадку пошук не може закінчитися глухим кутом і потрібна інформація може бути знайдена при русі по різних шляхах. Така система пошуку більше нагадує павутину, ніж дерево і саме ця асоціація лежить в основі назви технології WWW - "всесвітня павутина". Технологія WWW була розроблена в Європейському центрі ядерних досліджень (CERN) і грунтується на архітектурі клієнт / сервер. Програма броузер виконує роль клієнта, з її допомогою можна з'єднатися з програмою-сервером (Web-сторінкою), що знаходиться в будь-якому місці мережі Internet. При знаходженні необхідної інформації, вона передається програмі-клієнту. При відсутності потрібної інформації програмі-клієнту передаються посилання на інші сервери і так до тих пір, поки шукані відомості не будуть знайдені. Web містить мільйони документів, однак прямий доступ можливий лише до тих небагатьох джерел, на які є посилання на відкритої в даний момент сторінці. При цьому переважна кількість документів Web залишається поза полем зору. Щоб виправити таку ситуацію, завбачливі програмісти розробили цілий ряд служб, у які закладено той чи інший метод пошуку документів, що не має прямих посилань.

1.1 Пошукові служби

інтернет глобальний пошук інформація

Загальним підходом для всіх служб є пошук за заданим користувачем ключовими словами. Наявність заданих ключових слів перевіряється в тілі документа, його заголовку або посиланнях. У ході пошуку формується Web-сторінка результатів, що містить адреси URL, назви та короткі описи знайдених джерел. Загальна послідовність роботи з усіма службами однакова.

1. Відкрийте початкову сторінку служби.

2. Введіть ключові слова для пошуку та натисніть. Програма повертає Web-сторінку з першою групою знайдених джерел, які відповідають умовам пошуку.

3. Виявивши в списку потрібне джерело, клацніть на посиланні. Броузер відкриє відповідну Web-сторінку.

За способом пошуку та організації результатів всі програми пошуку можна розбити на дві групи. Системи індексування (search index) проводять пошук за заданим користувачем ключовими словами. Укладачі каталогів (search directory) організують Web-сторінки в систему ієрархічно пов'язаних розділів. Способів пошуку в такій системі багато, включаючи переміщення по посиланнях від розділів вищої до розділів нижчих рівнів. І ті, і інші виводять результати, використовуючи базу даних, яку складають, періодично роблячи рейди по мережі.

1.2 Що таке пошукові індекси і каталоги

Індекс використовується для пошуку Web-сторінок за ключовими словами, каталог - по розділах, систематизованим за ієрархічним рубриками.

Агенти мають вбудовані засоби пошуку документів І NetScape Navigator, і Microsoft Internet Explorer мають вбудовані засоби, що дозволяють швидко знаходити потрібні сторінки.

Пошукова система - потужний інструмент, що дозволяє дізнаватися про все на світі: від результатів останніх спортивних матчів до щоденних подій. Завдяки правильно організованому засобу пошуку Web стає невід'ємною частиною повсякденного життя користувача.

PointCast Client - одна з кращих пошукових систем, яка дозволяє отримувати останні новини безпосередньо на робочий стіл комп'ютера. А головне, вона абсолютно безкоштовна!

Можливості потужних систем пошуку виходять далеко за межі простого вміння знаходити Web-сторінки. Багато з них мають вбудовані засоби пошуку адрес електронної пошти, телефонних номерів і повідомлень груп новин. Деякі дозволяють знаходити географічні карти, наприклад, детальні плани міст.


1.3 Індекси

Поява індексу є результатом роботи трьох елементів програми індексування. Власне пошук за ключовими словами виконує Пошукова система (search engine). Саме до цієї частини програми індексування звертається користувач, задаючи умова пошуку в рядку для ключових слів. Пошук проходить в організованій програмою базі даних. Сукупність знайдених посилань і адрес URL оформляється у вигляді Web-сторінки результатів. Системи різняться своїми можливостями. Деякі з них підтримують використання ключових виразах булевих операторів, дозволяючи істотно звузити область пошуку. Інші, навпаки, збирають усе, що містить принаймні одне із заданих ключових слів.

"Павук" (spider) (іноді називають "хробаком" (worm) або "гусеницею" (crawler)) повинен виявити як можна більше Web-сторінок. Для цього він "запам'ятовує" всі посилання на відкриті їм документи. У виявлених таким чином нових сторінках знову відшукуються і запам'ятовуються посилання. Ця процедура повторюється до тих пір, поки не будуть вичерпані всі джерела посилань. Однак очевидно, що подібний метод не може гарантувати всеосяжних результатів: чи потрапить той чи інший джерело в число зібраний "павуком" сторінок, цілком залежить від наявності посилань на нього в інших документах Web.

Кожного разу, коли "павук" знаходить чергову Web-сторінку, упорядник індексу (indexer) вивчає вміст, заносячи слова, знайдені в посиланнях і тексті сторінок, в гігантську базу даних, ущільнити базу і очистити її від повторюваних елементів можна за допомогою високоефективних алгоритмів будови баз даних, закладених в упорядник індексу. Це нескладно, адже в людської мови поки що не використовуються унікальні слова. Укладач індексу має в результаті створити базу, в якій URL адреси були б співвіднесені з наборами зустрічаються у них слів.

Якщо яку-небудь Web-сторінку не вдається знайти, це ще не означає, що такої сторінки не існує. Багато пошукових систем генерують списки, в яких споріднені теми зібрані у розділи, організовані за принципом каталогів (такий принцип закладено, наприклад, в Yahoo!). Якщо вам не вдається знайти потрібні матеріали - скажімо, про догляд за йоркширським тер'єром (grooming Yorkshire Terrier), спробуйте відшукати їх за індексом. Цілком можливо, шукана тема виявиться серед його посилань.

Щоб підвищити ефективність пошуку за індексом, зробіть умова пошуку більш загальним і додайте ключове слово "index". Так, умова Grooming AND (Yorkie OR "Yorkshire Terrier") слід змінити на Index AND (Yorkie OR Yorkshire). He виключено, що менш конкретна умова Index AND Terrier дасть ще кращі результати. Якщо умова вибране вдало, пошукова система поверне один або кілька індексів, що посилаються на сторінки про йоркширської породі і тер'єрів.

1.4 Укладачі каталогів

На перший погляд відрізнити програми індексування від укладачів каталогів важко. Матерія для пошуку для обох інструментів служить вміст Web-сторінок. Однак, на відміну від програм індексування, укладачі каталогів не розшукують усі Web - сторінки Internet. Об'єктом пошуку для них є адреси URL, які включаються до систематизований каталог. Пошук по каталогу можна проводити як за допомогою броузера, так і вручну, клацаючи на назвах розділів і знайомлячись з їх вмістом.

Тим не менш, незважаючи на принципові відмінності у механізмах роботи, грань між грамами індексування та складання каталогів поступово стирається. Все частіше можна зустріти індекс, забезпечений засобами побудови каталогу. Нерідко самі Web-сторінки у верхній частині мають якусь подобу змісту з посиланнями на окремі розділи.


2. ПОПУЛЯРНІ ПОШУКОВІ СЛУЖБИ

Правильний вибір інструменту пошуку - ключовий момент пошукової стратегії. Якщо не допомагає одна служба, можна спробувати інші

Параметри браузера можна змінити так, щоб деяка Web-сторінка відображалася щоразу, коли відбувається запуск Internet (стала початковою сторінкою за замовчуванням). Зробивши початкової Web-сторінку будь-якої пошукової служби, ви отримаєте негайний доступ до всього набору засобів пошуку, якими володіє дана служба. Excite, InfoSeek і Yahoo! є для цього кращими кандидатами.

2.1 Тематичні каталоги

Найбільш популярним у всьому світі визнано тематичний каталог Yahoo! (http://www.yahoo.com/). Він являє собою величезну базу даних URL-адрес сайтів самої різної тематики. Yahoo! пропонує вам скористатися ієрархічним деревом при пошуку інформації. Тобто ви обираєте спочатку загальну тематику, що задовольняє вашому запиту інформації, і далі конкретизуєте, слідуючи підказкам каталогу. У звісно результаті ви отримуєте список сайтів, що містять інформацію, відповідну вашому запиту. На Yahoo! ви також можете піти й іншим шляхом. Проаналізуйте передбачуване зміст запитуваної інформації та виберіть ключові слова, які обов'язково зустрінуться в цікавлять вас матеріалах або їх заголовках. Набираєте ці слова через пробіл в рядку введення на головній сторінці Yahoo! і натискаєте Enter. Система спробує сама підібрати цікаву для вас інформацію. Так як Yahoo! система англомовна, то досить зручно використовувати Інтернет-перекладач, такий як "Сократ Інтернет" (http://www.arsenal.ru/).

Якщо ж ви шукайте інформацію завідомо російськомовну, то має сенс використовувати російські каталоги. Принцип роботи з ними ідентичний, тому що ми розглянули на прикладі з Yahoo!. Тут варто відзначити перший російський каталог Russia on the Net (http://www.ru/), один з найбільших російськомовних каталогів List.RU (http://www.list.ru/), російський варіант Yahoo! (http:/ / www.yahoo.ru/). Має місце, також, каталог "Сузір'я Інтернет", який містить лише обрані (заявлено як найцікавіші) ресурси. Говорячи про бази даних, не можна не згадати чудовий російський проект "Жовті сторінки Інтернет" (http://www.piter-press.ru/yp), де як і в однойменній книзі представлена детальна інформація про самих різних ресурсах Інтернет. У бізнесі також знадобляться каталоги підприємств і каталоги товарів і послуг. Мабуть, самий великий каталог підприємств СНД Партнер (http://trifle.net/cis).

Страницы: 1, 2


Новости

Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

  скачать рефераты              скачать рефераты

Новости

скачать рефераты

© 2010.