Стратегії пошуку інформації в інтернеті
Зараз найбільш популярні такі послуги інтернету: веб-форуми, блоги, вікі-проекти (зокрема, Вікіпе- дія), інтернет-магазини, інтернет-аукціони, соціальні мережі, електронний підпис, групи новин (в основному, Usenet), електронні платіжні системи, інтернет-радіо, інтернет-телебачення IPTV, IP-телефонія, ме- сенджери, пошукові системи, інтернет-реклама, віддалені термінали та управління, інші послуги.
Перегляд веб-сторінки здійснюється за допомогою спеціального редактора об’єктів - браузера. Браузер - це комп’ютерна програма у вигляді зручного для користування вікна. На даний час існує доволі багато браузерів, найбільш популярні серед них в Україні Google, Opera, Mozilla Firefox, Safari.
Сьогодні інтернет - це найбільший світовий інформаційний ресурс, що містить практично всю інформацію, якою може зацікавитись людина. Але популярне порівняння мережі з величезною бібліотекою неправомірне через відсутність будь-якої систематизації її ресурсів і хаотичне стрімке збільшення кількості посилань. Тому «потенціал для вирішення задач» інтернету (корисність інформації, одержаної за її допомогою) є досить низьким - користувач не може розраховувати на одержання інформації, яка буде водночас задовольняти три базові вимоги - своєчасність, достовірність, повнота. Отже, використання інтернету з професійною метою становить проблему, яка постійно ускладнюється.
У цьому контексті вводиться поняття «медіа-компетентність», яке позначає систему навичок пошуку в інтернеті і застосування інформації з раціональним рівнем потенціалу вирішення задач. Вебсер- фінг - заняття захоплююче, але малопродуктивне. Тому для пошуку потрібної інформації користувач має звертатись до спеціальних сервісів.
Існують три базові стратегії, які можуть бути використані:
1) перегляд пошукових каталогів - найчастіше це неефективна стратегія, яка дає безсистемні результати.
Пошук здійснюється кроками, через вибір загальної категорії, потім - підкатегорії тощо за існуючою ієрархією. Складність такого пошуку полягає в тому, що користувач має визначити, до якої категорії належить його тема, а за відсутності стандартів кожен каталог має свою систематику і специфічне наповнення;2) перехід за гіперпосиланнями від стартової сторінки. Ефективність цієї стратегії залежить від вибору початкового сайту або веб-сторінки. Більшість мегапорталів мають рейтинги сайтів, позначені як «Тор» або «Сої». Такі рейтинги створюються за кількістю відвідувань їх користувачами. Але інформаційні потреби різних користувачів не збігаються, тому до таких рейтингів слід ставитись з обережністю;
3) пошук за допомогою пошукових систем. На відміну від каталогів, такий пошук не обмежується окремою категорією. Ця стратегія може бути використана і для пошуку першої сторінки.
Використовуючи пошукові системи інтернету, потрібно враховувати такі фактори, що впливають на результативність пошуку:
- кожна пошукова система мережі має свою спеціалізацію;
- пошук здійснюється не за повними текстами документів, а за їх пошуковими образами, при цьому кожна система має оригінальний механізм роботи з ключовими словами. Зокрема, якщо база даних системи невелика, то до неї записується більше термінів інакше відбираються «найвагоміші» ключові слова;
- запити і їх інтерпретація реалізуються в пошукових системах по-різному.
Більшість систем надають користувачеві можливість сформулювати простий запит у формі фрази природною мовою без загальних слів, сполучників і прийменників або складний запит, який враховує специфіку пошукового апарату системи. Складний запит дає змогу варіювати різні параметри пошукового процесу.
Для того щоб підвищити ефективність пошуку, слід провести попередній аналіз теми інформаційного запиту і визначити:
- унікальні слова, спеціальні терміни, назви, абревіатури або акроніми для даної теми. Пошук за такими словами найбільш ефективний. Для точного надання граматичної форми слова слід розрізняти великі і малі літери, у деяких системах з цією метою також використовується символ «!».
Якщо розшукується назва, перед відповідним словом може вказуватись оператор «title:»;- спільноти, організації, установи або окремі особи, сайти або веб-сторінки яких можуть містити потрібну інформацію або корисні посилання. Знайдені сторінки можуть стати стартовими для подальшого пошуку;
- стійкі вирази (словосполучення, фрази), які стосуються даної теми, наприклад «правове регулювання» або «набуття чинності законом». Для такого пошуку слід використовувати лапки (дужки) або оператори відстані. Це уточнює запит і зменшує кількість документів, що видаються;
- інші слова, які можуть траплятись у будь-якому документі із заданої теми. Як ключові слова найчастіше використовуються іменники, рідше - прийменники і зовсім рідко - дієслова, прислівники, прийменники, сполучники.
Пошук може здійснюватись як за окремим словом, так і їх сукупністю - слова сполучаються за допомогою логічного оператора «AnD» (від англ. «та») або символу «+». На запит з одним словом система видасть більшу кількість посилань, але при збільшенні слів результати будуть точнішими.
Бажано визначити для кожного слова із запиту можливі синоніми, еквівалентні терміни, інші варіанти написання. Синоніми можна вказати у цьому ж запиті через оператор «OR» (від англ. «або») або використати в наступному запиті, якщо перший не дав бажаних результатів. Деякі системи дають змогу вказати сукупність еквівалентних термінів за допомогою дужок. Слід також враховувати існування різних словоформ (наприклад, різних закінчень), якщо така можливість надається системою. Наприклад, вираз правов* може охоплювати слова «правовий», «правове», «правова» та ін. Деякі системи роблять це автоматично.
Варто також зважати, що деякі пошукові системи ігнорують так звані «стоп-слова» - прийменники, частки, сполучники тощо, а деякі їх ураховують.
Виключити з пошукового запиту певні слова можна за допомогою оператора «пОТ» (від англ. «не») або символу «-». Наприклад, запит малі підприємства - кооперативи означає, що зі списку знайдених ресурсів будуть виключені ті, в яких трапляється слово «кооперативи».
Після завершення обробки запиту система видає список посилань на веб-сторінки та інші елементи інформаційних ресурсів інтернету.Слід також пам'ятати, що в інтернеті існують ресурси, не охоплені пошуковими системами та пошуковими каталогами - так званий «невидимий Web». «Невидимий веб» можна розбити на дві частини:
— вміст спеціалізованих баз даних, які не зберігаються у вигляді певних веб-сторінок, а динамічно формуються спеціально у відповідь на конкретний запит до цієї бази;
— сторінки, які виключають з поля зору пошукової системи згідно з прийнятою політикою. За відсутності конкретних технологічних причин до бази даних пошукової системи можуть включатись тільки ті сторінки, що відповідають певному критерію. Особливо це актуально для пошукових систем із величезними обсягами індексів.
У будь-якому разі пошук інформації в інтернеті - це завдання, яке вимагає творчого підходу, а стратегії пошуку повинні змінюватись залежно від результатів, що видаються у відповідь на запит. Опановувати їх доцільно ще й тому, що сфера використання інструментарію пошукових систем розширюється - створюються версії популярних систем для окремих вузлів інтернету та корпоративних інтрамереж.
Технології пошуку інформації в інтернеті.
Агент - це програма, розміщена у певному середовищі і здатна до гнучкої автономної поведінки для досягнення визначеної мети. Агент не тільки сприймає імпульси від середовища, в якому він функціонує, а й може змінювати його. У користувача немає необхідності втручатись у роботу агента, контролювати його дії або внутрішній стан. Гнучкість агента виявляться у його проактивності, здатності до змін і взаємодії з користувачами та іншими агентами.
Початковою функцією агентів був поточний контроль за діяльністю центрального процесора та периферійного обладнання. Сьогодні агенти розрізняються за функціями, що вони виконують, зокрема виділяють класи мобільних та інтелектуальних («розумних») агентів.
Мобільні агенти - програми, що переміщуються в базах даних і знань (зокрема, у веб-вузлах) для пошуку інформації.
Звичайний агент розміщується в інформаційній системі користувача, тоді як мобільний переміщується в ту систему, в якій є дані, що їх слід розшукати, і після закінчення пошуку в одній базі може перейти до іншої системи. Для прискорення процесу пошуку мобільний агент може створювати пі- дагентів і розсилати їх для паралельної роботи. Результати пошуку передаються користувачеві через мережу. Крім пошуку інформації мобільні агенти можуть виконувати ділові процедури, наприклад агенти покупців і продавців, зустрічаючись в інтернеті, можуть укладати комерційні угоди.Агенти, що їх позначають як інтелектуальні, крім названих вище функцій, можуть вести спостереження і здійснювати вимірювання, керувати комп'ютерними мережами, передавати повідомлення, сортувати електронну пошту. Програмні агенти змінюють людино-машинний інтерфейс - на їх основі розробляються інтерактивні персонажі, з якими можна спілкуватись і радитись.
Роботи з інтелектуальних агентів є відгалуженням досліджень зі штучного інтелекту. Для їх створення застосовується апарат нейронних мереж, нечіткої логіки, інтерпретації текстів природною мовою, колаборативної фільтрації (видачі рекомендацій індивідуальному користувачеві на основі відомостей про переваги певного співтовариства, до якого він належить). Незважаючи на великі можливості названих технологій, для їх реалізації потрібні потужні суперкомп'ютери, розподілені сховища даних, ефективні ни- зькорівневі технології пошуку та операційні системи, що підтримують виконання мобільного коду.
Але, незалежно від їх втілення, програмні агенти мають одне спільне завдання - підвищення продуктивності та ефективності роботи користувачів. Для цього вони виконують таку кількість дій, яку людина не в змозі зробити самостійно через їх трудомісткість або складність.
З огляду на вказане найбільш актуальним напрямком використання програмних агентів є пошук і збирання інформації. Представниками класу програмних агентів є веб-роботи, які виконують індексування для пошукових систем.
Робот (неофіційна назва «мандрівник, кроулер, павук») - це програма, яка автоматично простежує гіпертекстові сторінки, обираючи документ і переходячи на інші документи, на які він посилається. Для визначення порядку переходу до наступної сторінки робот може застосовувати певні евристики. Вживання роботів призводить до непорозумінь, оскільки справляє враження, що програма переміщується між сайтами як мережний комп'ютерний вірус, тоді як робот тільки звертається до сайтів, запитуючи документи.Такі програми пропонуються і кінцевим користувачам. При цьому слід зазначити, що звичайний веб-браузер не є роботом, оскільки ним керує людина і він не видає автоматично документи за гіперпосиланнями.
Пошукові агенти мають наступні переваги порівняно зі звичайним зверненням до пошукових систем:
— пошуковий агент передає користувачеві не просто результати роботи пошукової машини, а й попередньо переглядає документи і вибирає з-поміж них найбільш релевантні, з його погляду;
— агент може налаштовуватись на переваги користувача, враховувати обмеження на пошук;
— деякі агенти можуть працювати в оффлайн режимі - користувач дає завдання агенту і відключається від мережі, а агент виконує завдання на сервері і передає результати користувачеві, як тільки він знову підключиться. Агенти можуть шукати інформацію щогодини, щодня, щотижня, щомісяця (залежно від налаштування);
— агенти можуть навчатись - користувач оцінює роботу агента, а той може скоригувати свої критерії відбору інформації, враховуючи ці оцінки.
— Таким чином, пошукові агенти можуть розглядатись як інтелектуальна надбудова над пошуковими машинами.
3.4.
Еще по теме Стратегії пошуку інформації в інтернеті:
- Тема 3. Організація пошуку правової інформації в інтернеті
- Організація простого та розширеного пошуку інформації у пошукових серверах глобальної мережі Інтернет
- Практична робота 6. Пошук правової інформації у мережі. Робота з інформаційно-правовою системою «Ліга:Закон».
- Використання інформаційних ресурсів інтегрованої інформаційно-пошукової системи Національної поліції України для пошуку інформації
- 1. Вимоги до подання інформації у фінансових звітах. Якісні характеристики інформації та критерії її оцінювання
- 15.1. Загальна характеристика оперативно-розшукової інформації Оперативно-розшукова діяльність здійснюється заради отримання інформації, її накопичення, обробки, аналізу і висновків та вжиття відповідних заходів.
- Пошук людей в глобальній мережі за допомогою онлайн-сервісів
- 4. Основні напрямки реформування антикорупційної стратегії України із урахуванням міжнародних практик.
- 4.Розробка стратегії зовнішньоекономічної діяльності підприємства.
- Стратегії та моделі виживання вітчизняних домогосподарств в умовах кризи
- Управління джерелами фінансування оборотних активів і види стратегії фінансування
- Урядові пошуки розв’язання правоохоронних проблем.
- Пошук оптимальної виборчої системи України – простір для дискусій
- Пошук оптимальної територіальної організації влади у період 2001-2003 pp.
- Отримання інформації про злочин
- Зняття інформації з каналів зв'язку
- Місце засобів масової інформації у єдиному інформаційному просторі та їх правове регулювання
- Потреба в отриманні розвідувальної інформації в інтересах безпеки суспільства і держави
- Джерела інформації в оперативно-розшуковій діяльності
- Розголошення інформації.