Смекни!
smekni.com

Iнструментальнi засоби пошуку iнформацii в Iнтернет (стр. 3 из 5)

2.3 Системи мета-пошуку

Читаючи про всі перераховані пошукових службах, по неволі задумаєшся: "а якщо для пошуку необхідної інформації не достатньо однієї пошукової служби, то невже доведеться входити на всі тут перераховані сервера і кожен раз повторювати один і той самий запит?!". Найбільш якісний результат якраз буде саме за такого підходу. Але можна, виходячи з економії часу і грошей, скористатися системами мета-пошуку. Найбільш популярна в світі система такого класу Search.com (http://www.search.com/), але якщо ми працюємо переважно з російськомовними документами, то можна використовувати Savvy Search (http://guaraldi.cs.colostate.edu: 2000/form? lang = russian). Це досить потужна система відсилає ваш запит на 13 найбільших пошукових машин (в тому числі і російських) і повертає вам їх звіти. Інша російська система мета пошуку "Слідопит" (http://www.medialingua.ru/www/Wwwsearc.htm) працює лише з п'ятьма англомовними пошуковими машинами і однієї російськомовної, але цікава тим, що переводить ваш російськомовний запит на англійську мову для англомовних пошукових машин.

Також існують так звані мультипошукові сторінки:

"Все в одному" (http://www.tpi.ac.ru/ ~ mike / search / index.htm);

Search (http://www.informika.ru/windows/intern/poisk/main.html);

БКФ Пошук (http:/bforum.virtualave.net/index09.htm) та інші.

Ці сервера не вміють посилати запити та отримувати звіти від пошукових служб як системи мета-пошуку. Мультіпоісковие сторінки завантажують у безлічі вікон пошукові служби та передають їм ваш запит. До того ж такі системи працюють не стабільно.

2.4 Системи пошуку в конференціях Usenet

У всьому світі вважається найкращим сервісом для пошуку інформації у конференціях Usenet сервер DejaNews (http://www.dejanews.com/). Серед російськомовних виділяється сервер RusNews (http://news.corvis.ru/), що є також новинним сервером, що містить більше 2000 новинних груп. Точно також як і в інших пошукових службах ми набираємо рядок запиту, а сервер нам формує список конференцій, що містять наші ключові слова. Далі треба підписатися на відібрані нами конференції в нашій програмі роботи з новинами. Також має місце аналогічний російський сервер ТІЛА-пошук (http://tela.dux.ru/news.html).

Мережеві новини Usenet, або, як їх прийнято називати в російських мережах, телеконференції - це, мабуть, другий за поширеністю сервіс Інтернет. Якщо електронна пошта передає повідомлення за принципом "від одного - одному", то мережні новини передають повідомлення "від одного - багатьом". Механізм передачі кожного повідомлення схожий на передачу чуток: кожен вузол мережі, що довідався щось нове (тобто отримав нове повідомлення), передає новину всім знайомим вузлам, тобто всім тим вузлам, з ким він обмінюється новинами. Таким чином, послане Вами повідомлення поширюється, багаторазово дублюючи, по мережі, досягаючи за досить короткі терміни всіх учасників телеконференцій Usenet в усьому світі. При цьому в обговоренні цікавить Вас теми може брати участь безліч людей, незалежно від того, де вони знаходяться фізично, і Ви можете знайти співрозмовників для обговорення найбільш незвичайних тем. Кількість користувачів Usenet досить велика - за оцінками UUNET technologies, кількість нових повідомлень, що надходять у телеконференції щодня, складає близько мільйона.

Новини розподілені за ієрархічно організованими тематичними групами, й ім'я кожної групи складається з імен підрівнів ієрархії, розділених крапками, причому більш загальний рівень пишеться першим. Розглянемо, наприклад, ім'я групи новин comp.sys.sun.admin. Ця група відноситься до ієрархії верхнього рівня comp, призначеної для обговорення всього, пов'язаного з комп'ютерами. В ієрархії comp є підрівень sys, призначений для обговорення різних комп'ютерних систем. Далі, sun означає комп'ютерні системи фірми Sun Microsystems, а admin позначає групу, призначену для обговорення питань адміністрування таких комп'ютерних систем. Отже, група comp.sys.sun.admin призначена для обговорення питань адміністрування комп'ютерних систем фірми Sun Microsystems. Таким чином, зазвичай, маючи мінімальні знання англійської мови, можна по імені групи легко зрозуміти, що в ній обговорюється. Наприклад, в alt.games.vgaplanets пишуть любителі гри Vga Planets, а jet.testing призначена для посилки тестових повідомлень в групу, локальну для компанії Jet Infosystems.

Існують глобальні ієрархії, як-то comp, та ієрархії, локальні для якої-небудь організації, країни чи мережі. Взагалі кажучи, набір груп, які отримує Ваш локальний сервер Usenet, визначається адміністратором цього сервера і наявністю цих груп на інших серверах, з якими обмінюється новинами Ваш сервер. Однак, звичайною є ситуація, коли сервер отримує, по-перше, всі глобальні ієрархії, по-друге, групи, локальні для вашої країни і мережі, і, по-третє, групи, локальні для Вашої організації. Наприклад, до першої групи належать ієрархії comp, news, misc, alt, rec, до другої - ієрархії relcom і fido7 в Росії та ієрархія de у Німеччині, до третьої - ієрархії jet для Jet Infosystems і cern в CERN.

До різних ієрархій застосовуються різні норми і правила роботи з ними. У першу чергу, це стосується мови повідомлень - у групи російської ієрархії relcom найкраще писати російською, в той час як у групи глобальної ієрархії comp можна писати лише англійською. Не завжди в Usenet можна посилати інформацію рекламного характеру - наприклад, ви можете вільно посилати рекламні повідомлення в групи ієрархії relcom.commerce, спеціально для того і створені, а от у групи fido7 некомерційною мережі FIDO посилати рекламу суворо заборонено. Менш суворими є обмеження на можливі обсяги цитування попередніх авторів у Вашому листі, розмір підпису Вашого листа і т.д.

Починаючи працювати з якою-небудь групою або ієрархією груп, в першу чергу потрібно прочитати правила роботи з ними, які регулярно поміщаються в ці групи людиною, добровільно взяли на себе обов'язки координатора групи (модератора). Насправді, групи новин бувають двох типів - модеровані та звичайні. Повідомлення, що з'являються в модерованих групах, перш ніж бути розісланими у мережі, проглядаються модератором. Це, звичайно, є свого роду цензурою, але в такому величезному співтоваристві, як Usenet, неможливо підтримувати порядок без таких суворих заходів. Сьогодні будь-який комп'ютер, повноцінно підключений до Інтернет, має доступ до новин Usenet, але новини Usenet поширюються і в інших мережах, застосовуючи настільки ж широко, як і електронна пошта. Способи й зручність роботи з новинами сильно залежать від того, яким чином Ви отримуєте їх. В Інтернет Ваша програма-клієнт напряму отримує новини із сервера Usenet, і між переглядом списку повідомлень, що містяться в групі, і читанням цих повідомлень немає затримки. Якщо Ви користуєтеся новинами через електронну пошту, то Ви спочатку одержуєте список статей, а вже потім приймаєте електронною поштою статті зі списку, окремо Вами замовлені. Такий спосіб роботи з новинами Usenet є сьогодні найбільш поширеним в Росії, але насправді це досить незручний і застарілий метод.


2.5 Служби пошуку людей

У вас з'явилася можливість працювати з електронною поштою, але ви не знаєте адрес електронної пошти партнерів вашої організації. Завдяки, так званим, службам пошуку людей в Інтернет, вказавши ПІБ вашого опонента теоретично ви можете отримати його адресу електронної пошти та URL-адресу. Чому теоретично? Справа в тому, що системи пошуку людей, в основному беруть інформацію про електронні адреси з відкритих джерел, таких як конференції Usenet. Де гарантія, що ваші партнери беруть участь у цих конференціях? І тим не менш розглянемо деякі служби пошуку людей. У першу чергу, традиційно, про саму популярну англомовної системі Four 11 (http://www.four11.com/). Це дійсно великий сервер - його база даних містить майже 6 000 000 адрес. Серед російськомовних служб можна виділити Е-Рос (http://www.dubna.ru/eros).


3. ПРИЙОМИ ЕФЕКТИВНОГО ПОШУКУ

Різні методики пошуку, приводять до різних результатів. Останні, приміром, залежать від того, який логічний оператор використаний у ключовому вираженні. Нижче наведено кілька основних правил підбору ключових слів.

• Чим конкретніше поняття, що позначається ключовим словом, тим краще. Це звужує область пошуку і робить його більш предметним. Наприклад, не слід вводити слово "dog" (собака), якщо не можна пошукати відомості про Карликовий пудель.

• Уникайте загальновживаних слів. В якості ключових марно використовувати такі слова, як "that", "the", "program", "internet". Вони настільки поширені, що пошук по них дасть багато тисяч сторінок.

• Пробуйте різні форми одного години того ж ключового слова. Наприклад, якщо шукані сторінки повинні містити відомості про біг (running), пробуйте пошук по всіх трьох форм: "run", "runs", "running".

• Не забувайте про синоніми. Так, крім "running" (біг), можна використовувати також "jog" (біг підтюпцем). У висловлюваннях з булевими операторами не забувайте розділяти синоніми оператором OR.

• Пробуйте різні варіанти. Якщо знайдених сторінок виявилося занадто багато, спробуйте звузити умови пошуку. Навпаки, якщо результат занадто мізерний, що використовується ключове слово слід замінити більш загальним поняттям. Перший вибір далеко не завжди оптимальний.

• Не забувайте додавати лапки. Вони обов'язкові, якщо ключове слово або вираз являє собою назву. Наприклад, щоб знайти в Internet згадка про цю книгу, в рядку для ключових слів потрібно ввести: "Special Edition Using the Internet". He забудьте поставити лапки.

• Враховуйте регістр символів. Результат пошуку нерідко залежить від того, в якому регістрі записано ключове слово. Так, якщо воно записано малими буквами, програма повертає сторінки, де цей вираз записано як малими, так і великими. Однак якщо в рядок для пошуку ввести прописні символи, регістр буде суворо дотриманий: програма знайде тільки ті сторінки, де цей вираз цілком записано прописними.