Метадані — це субканальная інформація про використовуваних даних. Структуровані дані, що представляють собою характеристики описуваних сутностей для цілей їх ідентифікації, пошуку, оцінки, управління ними. набір допустимих структурованих описів, які доступні в явному вигляді і призначення яких може допомогти знайти об'єкт. Термін використовується в контексті пошуку об'єктів, природ, ресурсів.
Дані з більш загальної формальної системи, що описує задану систему даних. Інформація про міститься на веб-сторінці інформації (творця тощо). Приклад: Ім'я автора правки в тексті.
Цей термін у широкому сенсі слова використовується для будь-якої інформації про даних: імена таблиць, колонок в таблиці в реляційних базах даних, номер версії у файлі програми (тобто як інформативна частина в бінарному файлі) і т. п.
Структуровані у вигляді ієрархії метадані більш правильно називати онтологією або схемою метаданих (наприклад, XML-схема).
Зазвичай неможливо провести однозначне поділ на дані та метадані в документі, оскільки:
Що може бути як дані, так і метаданими. Так, заголовок статті можна одночасно віднести як до метаданих (як елемент метаданих — заголовок), так і до власне даними (оскільки заголовок є частиною самого тексту).
Дані та метадані можуть мінятися ролями. На вірш, розглянуте як дані, може бути написана музика, в цьому випадку весь вірш може бути «прикріплено» до музичного файлу і в цьому випадку розглядатися як метадані. Таким чином, віднесення до однієї чи іншої категорії залежить від точки зору (або простору імен, системи відліку).
Можливе створення мета-мета-...-метаданих (див. аксіома вибору). Оскільки, у відповідності зі звичайним визначенням, метадані є даними, то можна створити метадані метадані, метадані для виводу на спеціальні пристрої, або читання їх опису з використанням програмного забезпечення, перетворює текст в мову.
Інші описові метадані можуть використовуватися автоматизованими робочими потоками. Наприклад, якщо деяка розумна програма «знає» вміст і структуру даних, то дані можуть бути автоматично перетворені і передані іншій «розумної» програми як вхідні дані. В результаті, користувачі будуть звільнені від необхідності виконання безлічі рутинних операцій, якщо дані надані для роботи такими небагатослівними» програмами.
Метадані стають важливими в World Wide Web з причини необхідності забезпечення пошуку корисної інформації серед величезної кількості доступною. Метадані, створені вручну, мають велику цінність, оскільки це гарантує осмисленість. Якщо веб-сторінка на якусь певну тему містить слово або фразу, то всі інші веб-сторінки на цю тему можуть містити таке ж слово або фразу. Метадані також мають різноманітністю, тому якщо з якоюсь темою пов'язані два значення, то кожне з них може бути використано. Наприклад, стаття про Живий Журнал може бути означена за допомогою кількох значень: «Живий Журнал», «ЖЖ», «LiveJournal».
Метадані використовуються для зберігання інформації про записи audio CD. Аналогічно MP3 файли зберігають метадані у форматі ID3.
Редагувати метадані графічних файлів можна в спеціальних програмах для роботи з метаданими.
Метадані можна класифікувати за:
Змістом. Метадані можуть описувати сам ресурс (наприклад, назва і розмір файлу), або вміст ресурсу (наприклад, «у цьому відеофайлі показано як хлопець грає у футбол»).
По відношенню до ресурсу в цілому. Метадані можуть ставитися до ресурсу в цілому або його частин. Наприклад, «Title» (назва фільму) відноситься до фільму в цілому, а «Scene description» (опис епізоду фільму), окреме для кожного епізоду фільму.
По можливості логічного виводу. Метадані можна підрозділити на три шари: нижній шар — це «сирі» дані самі по собі; середній шар — метадані, що описують зазначені «сирі» дані; і верхній шар — метадані, які дозволяють робити логічний висновок, використовуючи другий шар.
Трьома найбільш використовуваними класами метаданих є:
Внутрішні метадані, що описують структуру чи складові частини речі, те, чим річ є. Наприклад, формат і розмір файлу.
Адміністративні метадані, що вимагаються для процесів обробки інформації, призначення речі. Наприклад, інформація про автора, редактора, дата публікації і т. п.
Описові метадані', які описують природу речі, її ознаки. Наприклад, набір пов'язаних з інформацією категорій, посилання на інші речі, пов'язані з даною.
Метаданими на практиці зазвичай називають дані, представлені у відповідності з одним з форматів метаданих.
Формат метаданих — представляє собою стандарт, призначений для формального опису деякої категорії ресурсів (об'єктів, сутностей тощо). Такий стандарт зазвичай включає в себе набір полів (атрибутів, властивостей, елементів метаданих), що дозволяють характеризувати аналізований об'єкт. Наприклад, формат MARC дозволяє описувати книги (і не лише книги), містить поля для опису назви, автора, тематики і безлічі інших характеристик (формат MARC дозволяє описати сотні характеристик).
Формати можна класифікувати, по-перше, за обсягом і подробиці типів описуваних ресурсів. По-друге, по ширині і подробиці області опису ресурсів і потужності структури елементів метаданих. Крім цього, можна класифікувати по предметним областям, або цілям розробки і використання формату метаданих.
Формати метаданих часто розробляються міжнародними організаціями або консорціумами, що включають в себе зацікавлені в появі стандарту державні організації та приватні компанії. Розроблений формат часто закріплюється як стандарт в одній або декількох організаціях, що займаються розробкою і прийняттям стандартів (наприклад W3C, ISO, ANSI і т. п.)
Класифікація форматів метаданих по розглянутій предметній області:
DCMI є одним з найбільш поширених в інтернет форматів метаданих для опису ресурсів будь-якого типу (як електронних документів, так і реальних фізичних об'єктів). Інші формати метаданих, призначені для опису архівів та інших електронних ресурсів GILS, EAD.
для опису персон і організацій vCard і FOAF
для опису бібліографічних ресурсів призначені формати колекції MARC (MARC 21, використовуваний в США і Великобританії, і UNIMARC, який використовується в Європі та Азії); UNIMARC у свою чергу підрозділяється на національні розширення цього формату (так, у Росії використовується RUSMARC); у силу великої складності форматів колекції MARC для вирішення завдань інтеграції даних був розроблений формат MODS.
для опису музейних та історичних цінностей використовується формат CDWA
для опису видавничої продукції використовуються PRISM і ONIX