CHITAT-KNIGI.COM
Читать бесплатно хорошую книгу!
  • Главная
  • Жанры
  • Авторы
  • ТОП книг
  • ТОП авторов
  • Контакты

Об ИИ без мифов. Путеводитель по истории Искусственного Интеллекта

Часть 45 из 53 Информация о книге

И все же основным делом жизни Тьюки был исследовательский анализ данных (Exploratory Data Analysis, EDA), служащий инструментом для изучения основных свойств данных, нахождения в них общих закономерностей, распределений и аномалий. Этот тип анализа отличается от, например, более известного и широко используемого метода статистической проверки гипотез тем, что не предполагает наличия некоторой априорной гипотезы, нуждающейся в подтверждении, – в EDA формулирование гипотезы, анализ и ее доказательство выполняются параллельно. В 1962 году Тьюки написал: «После долгих лет работы в области классической статистики я стал сомневаться в том, что для получения полной картины достаточно одной статистики, мои интересы стали смещаться в сторону более полного анализа данных, включая тонкие процедуры и методы анализа и интерпретации данных».

Работы Тьюки стали предпосылкой к интеллектуальному анализу данных – направлению, открытому Ильей Иосифовичем Пятецким-Шапиро (1929–2009), советским, а позже израильским и американском математиком. В 1989, покинув СССР, Илья Иосифович провел первый семинар Извлечение знаний из баз данных (Knowledge Discovery in Databases, KDD). Его дело продолжает сын Григорий Пятецкий-Шапиро (1958), живущий в США

Название Data Science предложил Петер Наур (Peter Naur, 1928–2016) в 1974 году. Датчанин Наур более всего известен как создатель одного из первых алгоритмических языков ALGOL 60 и нотации Бэкуса-Наура (Backus—Naur form, BNF). Он определил Data Science не совсем так, мы ее понимает сейчас, в его представлении это наука, изучающая жизненный цикл цифровых данных.

Крупнейший специалист в области баз данных Джим Грей (James Gray, 1944 – признан погибшим в 2012) радикально переосмыслил роль данных. За несколько недель до своего бесследного исчезновения на борту яхты у Калифорнийского побережья (2007) он выступил с речью, в которой представил свои соображения о качественных изменениях в современной науке, связанных с возможностью собирать и анализировать большие объемы экспериментальных данных. Для характеристики нового периода в науке Грей использовал термин «четвертая парадигма» (fourth paradigm). По Грею, тремя предыдущими парадигмами были экспериментальная, теоретическая и вычислительная.

Стартовым выстрелом для нынешнего периода в истории DS стало интервью Главного экономиста Google Хала Вариана (Hal Varian) изданию McKinsey Quarterly, где он выдал многократно повторенную сентенцию: «Статистик – самая привлекательная работа (sexy job). Колоссальную важность приобретет его способность взять данные, понять их обработать, выделить нужное, визуализировать и передать другим».

У DS находится общее с кибернетикой, это тоже не традиционная наука в науковедческом представлении, а междисциплинарный подход, объединяющий методы, процессы, алгоритмы, системы и другие средства, служащие для извлечения информации из сырых данных, в том числе структурированных и не структурированных. DS объединяет Data mining (иногда переводится как Интеллектуальный анализ данных или Добыча данных), Большие данные, CV и NLP как методы, используемые для извлечения информации из изображений и текстов.

Несколько слов о data mining

Историю DM можно начать с теоремы Томаса Байеса (1763), позволяющей вычислить вероятность события с учетом ранее известных и новых данных. Можно также вспомнить основополагающие работы в области регрессионного анализа Ариена-Мари Лежандра (1805) и Карла Гаусса (1809). С тех пор и поныне статистические методы извлечения полезной информации из данных были и остаются краеугольным камнем для DM. Собственно термин data mining был предложен в середине 80-х Робертом Хехт-Нильсеном (Robert Hecht-Nielsen, 1947–2019) основателем компании HNC (Hecht-Nielsen Neurocomputer Corporation), позже она вошла в состав компании FICO, признанного крупнейшего финансового аналитика. HNC первой разрабатывала ПО для прогнозов, основанное на нейронных сетях. В нем моделировалось распознавание информации, скрытой в данных, по образу и подобию человеческого сознания. Эти разработки имели оборонное назначение, что естественно для компании, находящейся в Сан-Диего, центре ВМС США, но позже областью приложения стала финансовая индустрия, страхование, розничная торговля.

Современный интеллектуальный анализ данных имеет в основе три составляющие – собственно данные, извлекаемая из данных информация и полученные из данных знания.

Метаданные и гипертекст

Художественные тексты и особенно стихи содержат в себе скрытые метаданные. Обычно символьные данные сами по себе никакого смысла не имеют, они становятся полезным источником информации в том случае, если сопровождаются вспомогательными данными, указывающими на то, как их интерпретировать. Простейший вид явных метаданных – запись данных в предопределенную структуру, например в СУБД или в электронную таблицу, где нахождение числа или слова в определенной позиции придает ему значение и открывает возможность для поиска и анализа. Такие метаданные можно назвать структурными. Есть альтернативный способ явного представления метаданных, он по идее прост – достаточно можно снабдить данные ярлыками-метками, указывающими на смысл, который имеют следующие за ним записи. Такая разметка удобна для неструктурированных данных, в том числе и записей на естественном языке.

С момента появления самых первых компьютерных систем для работы с текстами все электронные документы содержали те или иные символы для управления печатью (CR, LF и др.). Однако их возможности оставались весьма ограниченными, методы разметки были привязаны к определенным принтерам, а с появлением новых устройств с более широкими возможностями (такими, скажем, как принтер с шаровой головкой) потребовались новые средства управления печатью. Чтобы преодолеть этого ограничение исследовательская группа корпорации IBM, возглавляемая Чарльзом Гольдфарбом, разработала язык разметки GML, «отвязавший» текст от формата печати.

Последующие исследования Гольдфарб вел самостоятельно; в конечном итоге они привели его к созданию языка Standard Generalized Markup Language (SGML). В период с 1978-го по 1985 год язык проходил сложный процесс стандартизации. В конечном итоге он был принят и American National Standards Institute (ANSI), и европейским агентством Computer Office of Official Publications. На следующем этапе SGML попал в европейский центр исследований физики элементарных частиц (CERN). Здесь первое средство для использования SGML разработал Андерс Берглунд (Anders Berglund). В CERN была разработана и технология CERNDOC на основе SGML, которая в последующем оказалась столь успешной, что была принята американской ассоциацией издателей American Association of Publishers. Одним из активных пользователей этой технологии был Тим Бернерс-Ли (1955), создавший совместно с Робертом Кайо (Robert Cailliau, 1947) Всемирную паутину WWW, поэтому нет ничего удивительного в том, что при разработке HTML он использовал свой опыт работы с SGML.

И все же SGML оказался весьма сложен, поэтому широкого распространения не получил, зато стал прототипом для двух широко известных языков. Первый – XML (eXtensible Markup Language), служащий для кодирования документов в World Wide Web, второй – Hypertext Markup Language (HTML), используемый для кодирования документов, воспроизводимых браузерами.

К разметке близок гипертекст, этот термин был предложен в 1965 году Тедом Нельсоном (Ted» Nelson, 1937 года) который определил его следующим образом: «Массив текстов или графики, объединенных сложными связями, которые с достаточной полнотой не могут быть представлены в бумажной форме. Связи могут включать карты контента, ссылки, аннотации, комментарии и другие инструменты для указания». В истории гипертекста сложилась вполне устоявшаяся хронология событий. Точкой отсчета обычно называют Ванневара Буша и его гипотетическую машину Memex (Memory Extender), далее переходят к Дагу Энгельбарту, затем к Теду Нельсону и, наконец, к Тиму Бернерсу-Ли, работашему совместно с Робертом Калио.

Перейти к странице:
Предыдущая страница
Следующая страница
Жанры
  • Военное дело 2
    • Спецслужбы 2
  • Деловая литература 53
    • Деловая литература 1
    • Корпоративная культура 4
    • Личные финансы 7
    • Маркетинг, PR, реклама 9
    • О бизнесе популярно 28
    • Управление, подбор персонала 3
    • Экономика 5
  • Детективы и триллеры 921
    • Боевики 114
    • Дамский детективный роман 11
    • Детективы 414
    • Иронические детективы 81
    • Исторические детективы 183
    • Классические детективы 62
    • Криминальные детективы 66
    • Крутой детектив 42
    • Маньяки 8
    • Политические детективы 23
    • Полицейские детективы 124
    • Прочие Детективы 263
    • Техно триллер 2
    • Триллеры 485
    • Шпионские детективы 31
  • Детские 113
    • Детская образовательная литература 4
    • Детская проза 47
    • Детские остросюжетные 17
    • Детские приключения 49
    • Детские стихи 4
    • Прочая детская литература 14
  • Детские книги 226
    • Детская фантастика 80
    • Детские детективы 3
    • Книги для подростков 23
    • Сказки 63
  • Документальная литература 283
    • Биографии и мемуары 181
    • Военная документалистика 1
    • Искусство и Дизайн 4
    • Критика 3
    • Научпоп 3
    • Прочая документальная литература 26
    • Публицистика 91
  • Дом и Семья 55
    • Домашние животные 5
    • Здоровье и красота 11
    • Кулинария 6
    • Прочее домоводство 1
    • Развлечения 3
    • Сад и Огород 1
    • Спорт 2
    • Хобби и ремесла 3
    • Эротика и секс 27
  • Драматургия 16
    • Драма 15
    • Киносценарии 1
  • Жанр не определен 1
    • Разное 1
  • Компьютеры и Интернет 2
    • Базы данных 1
    • Программное обеспечение 1
  • Любовные романы 11686
    • Исторические любовные романы 370
    • Короткие любовные романы 921
    • Любовно-фантастические романы 5407
    • Остросюжетные любовные романы 203
    • Порно 30
    • Прочие любовные романы 25
    • Слеш 224
    • Современные любовные романы 4940
    • Фемслеш 19
    • Эротика 2399
  • Научно-образовательная 133
    • Альтернативная медицина 1
    • Астрономия и Космос 3
    • Биология 13
    • Биофизика 2
    • Биохимия 1
    • Ботаника 1
    • Военная история 2
    • Геология и география 3
    • Детская психология 3
    • Зоология 1
    • Культурология 17
    • Литературоведение 10
    • Медицина 14
    • Обществознание 3
    • Педагогика 6
    • Политика 13
    • Прочая научная литература 26
    • Психотерапия и консультирование 8
    • Религиоведение 2
    • Секс и семейная психология 5
    • Технические науки 1
    • Физика 5
    • Философия 11
    • Химия 1
    • Юриспруденция 3
    • Языкознание 6
  • Образование 266
    • Бизнес 45
    • Биография и мемуары 46
    • Здоровье 10
    • История 133
    • Карьера 4
    • Психология 135
  • Поэзия и драматургия 12
    • Драматургия 5
    • Поэзия 7
  • Приключения 248
    • Вестерны 2
    • Исторические приключения 142
    • Морские приключения 31
    • Природа и животные 15
    • Прочие приключения 54
    • Путешествия и география 17
  • Проза 769
    • Антисоветская литература 2
    • Военная проза 35
    • Историческая проза 121
    • Классическая проза 61
    • Контркультура 7
    • Магический реализм 32
    • Новелла 4
    • Повесть 13
    • Проза прочее 7
    • Рассказ 38
    • Роман 52
    • Русская классическая проза 25
    • Семейный роман/Семейная сага 1
    • Сентиментальная проза 3
    • Советская классическая проза 28
    • Современная проза 751
    • Эссе, очерк, этюд, набросок 1
  • Прочее 479
    • Газеты и журналы 2
    • Изобразительное искусство, фотография 6
    • Кино 2
    • Музыка 2
    • Театр 1
    • Фанфик 467
  • Религия и духовность 74
    • Буддизм 1
    • Православие 1
    • Религия 8
    • Самосовершенствование 20
    • Эзотерика 46
  • Справочная литература 22
    • Прочая справочная литература 2
    • Путеводители 5
    • Руководства 6
    • Справочники 8
    • Энциклопедии 4
  • Старинная литература 38
    • Античная литература 1
    • Древневосточная литература 4
    • Мифы. Легенды. Эпос 12
    • Прочая старинная литература 22
  • Техника 2
    • Автомобили и ПДД 1
    • Архитектура 1
  • Фантастика и фентези 11056
    • Альтернативная история 1545
    • Боевая фантастика 2417
    • Героическая фантастика 598
    • Городское фэнтези 656
    • Готический роман 2
    • Детективная фантастика 269
    • Ироническая фантастика 70
    • Ироническое фэнтези 57
    • Историческое фэнтези 166
    • Киберпанк 106
    • Космическая фантастика 680
    • Космоопера 12
    • ЛитРПГ 623
    • Любовная фантастика 183
    • Любовное фэнтези 113
    • Мистика 184
    • Научная фантастика 423
    • Попаданцы 3297
    • Постапокалипсис 348
    • Сказочная фантастика 4
    • Социально-философская фантастика 190
    • Стимпанк 54
    • Технофэнтези 20
    • Ужасы 103
    • Ужасы и мистика 292
    • Фантастика 250
    • Фантастика: прочее 103
    • Фэнтези 5671
    • Эпическая фантастика 125
    • Юмористическая фантастика 561
    • Юмористическое фэнтези 388
  • Фольклор 2
    • Народные сказки 2
  • Юмор 72
    • Анекдоты 1
    • Комедии 1
    • Прочий юмор 29
    • Сатира 1
    • Юмористическая проза 37
    • Юмористические стихи 3
CHITAT-KNIGI.COM

Читать онлайн бесплатно книги полностью без регистрации

Контакты
  • [email protected]
Информация:
  • Карта сайта
  • Слушать Аудиокниги
  • Руководства по ремонту автомобилей
© chitat-knigi.com, 2025. | Вход
Этот сайт использует cookie для хранения данных. Продолжая пользоваться сайтом, вы даете свое согласие на работу с этими данными в соответствии с нашей политикой конфиденциальности.
Я согласен