Мы проследили некоторую эволюцию ИИ-технологий и, подводя итог первой лекции, хотели бы рассмотреть, как из упомянутых технологий строятся ИИ-решения, какова их структура, каков набор и иерархия входящих в эти решения технологий искусственного интеллекта. Также в этом разделе поговорим о том, как меняется спектр наиболее востребованных технологий в современных ИИ-решениях, и завершим лекцию обсуждением вопроса «Где технологии ИИ пересекаются с другими областями знания?».
На рис. 2.35 показана схема, отражающая иерархию технологий, необходимых для построения современного ИИ-решения. Во внутреннем эллипсе представлены различные алгоритмы, на основе которых строятся ИИ-решения, в частности здесь перечислены упоминаемые нами ранее алгоритмы «дерево решений», «метод опорных векторов», «генетическое программирование», «линейная регрессия», «нейронные сети».
Следующий эллипс — это уровень исследовательских методов или научных школ искусственного интеллекта, включая рассмотренные нами символизм, коннекционизм и эволюционизм.
Рис. 2.35. Уровни ИИ. Источник: Упрощенный вариант по материалам
Далее показан эллипс, демонстрирующий базовые технологические направления, которые могут быть построены на основе различных алгоритмов — это уже рассмотренные нами ранее задачи компьютерного зрения, обработки естественного языка, экспертные системы, системы поддержки принятия решений и другие. И наконец, внешний эллипс отображает области внедрения ИИ-приложений, то есть комплексные решения, в которых ИИ-компоненты обеспечивают ту или иную часть их функциональности (финансы, умный город, здравоохранение, промышленность и другие).
Для того чтобы построить решение на базе ИИ, помимо программного обеспечения нужна инфраструктура, на которой все перечисленные приложения будут работать. Причем нужна специализированная инфраструктура, которая позволит обрабатывать типичные для ИИ-задач нагрузки с оптимальной производительностью. К числу инфра-структурных технологий, на которых строятся ИИ-решения, в схеме рис. 2.35 отнесены элементы аппаратного обеспечения (процессоры, память, нейроускорители, сенсоры и датчики, системы управления движением), программное обеспечение (алгоритмы, фреймворки, библиотеки, вычислительные среды, инструменты разработки) и данные (пакетные данные, потоковые данные, большие данные, разметка).
Говоря о технологиях, составляющих то или иное комплексное решение, следует отметить, что технологии быстро развиваются — совершенствуются алгоритмы, меняются вычислительные возможности, одни технологии устаревают и сходят с дистанции, другие массово применяются большинством участников рынка, третьи применяются в пилотных проектах, четвертые находятся еще только на стадии запуска. Иными словами, для того чтобы оценить, какие технологии используются в ИИ-решении и какие будут актуальны в ближайшей перспективе, требуется еще одна точка зрения — это взгляд, связанный с анализом жизненного цикла технологии от запуска до выхода на массовый рынок. Обратимся к материалам аналитической компании Gartner, которая ежегодно публикует так называемый цикл ажиотажа (Gartner Hype Cycle), показывающий стадию развития той или иной технологии с точки зрения ее зрелости и с точки зрения ее субъективного восприятия профессиональным сообществом. В данной методике Gartner исходит из того, что каждая новация проходит пять различных стадий, представленных на рис. 2.36.
Запуск технологии — научное открытие или иное событие, которое обращает внимание сообщества на новую технологию.
Пик завышенных ожиданий — стадия, на которой общественность обращает внимание на технологию и начинает возлагать на нее чрезмерные надежды.
Впадина разочарований, на которой пользователи выясняют, что те надежды, которые возлагались на технологию, не оправдались, специалистов, которые умеют доказать преимущества технологии, еще нет, и положительных примеров ее внедрения мало. На этой стадии СМИ обычно перестают писать о технологии, вследствие чего создается впечатление, что эта технология «ушла со сцены».
Подъем осведомленности — по мере того как люди адаптируются к новой технологии, узнают о ее применении и появляется больше сведущих в ней специалистов, наступает признание ее реальной пользы.
Плато продуктивности — на этой стадии технология становится стабильной, общепризнанной и широко применяемой.
Рис. 2.36. Кривые ажиотажа Gartner за 2017, 2019, 2021 гг.
Поскольку Gartner проводит оценку ИИ-технологий ежегодно, появляется возможность показать, как рассмотренные нами выше технологии, «проходят сквозь цикл ажиотажа». Нельзя сказать, что все технологии последовательно движутся вдоль кривой с одинаковой скоростью. Некоторые, как, например, технология сильного ИИ как находились на этапе запуска, так и остаются в этом состоянии, более того — ряд ученых полагают, что этой технологии не суждено воплотиться в полной мере на практике. Другие ИИ-технологии, такие как «распознавание речи» и «использование графических ускорителей» на кривой 2021 г., уже прошли плато продуктивности и находятся за пределами цикла, третьи (такие как, например, «семантический поиск») перемещаются в сторону «плато продуктивности».
Не для всех технологий можно показать, как они продвигаются по кривой ажиотажа, поскольку не все технологии, которые были, например, в фокусе внимания компании Gartner в предшествующие годы, попадают в область рассмотрения в последующие. Некоторые просто выпадают из поля зрения аналитической компании.
Когда говорят о наборе технологий, составляющих ИИ-решение, неизбежно заходит речь о том, где проходит граница между ИИ-технологией и смежными областями. Очевидно, что ИИ-технологии имеют области пересечения с другими технологиями, имеющими отношение к наукам о данных. Различные авторы пытались показать, в какой степени область искусственного интеллекта пересекается с другими технологиями, что позволяет лучше понять предмет ИИ как области науки. Существует достаточно много попыток отобразить графически данные пересечения в виде диаграмм Венна (например, они приведены в работах). Некоторые из этих диаграмм, на наш взгляд, имеют слишком ограниченный перечень областей, другие, напротив, перегружены подробностями и теряют наглядность. Мы остановились на диаграмме, которую в своих работах использовали специалисты компании SAS Institute ( рис. 2.37).
Рис. 2.37. Пересечение областей знаний, ассоциированных с обработкой данных. Источник: SAS
Пользуясь данной схемой, обсудим, где же технологии ИИ пересекаются с другими областями знаний. Начнем рассмотрение рис. 2.37 с области, представленной окружностью в верхней части рисунка — «распознавание паттернов». Технология распознавания паттернов подразумевает использование различных алгоритмов с целью выявления закономерностей в данных как с использованием, так и без использования машинного обучения.
Например, первые OCR-системы (относящиеся к технологии распознавания образов) не применяли алгоритмы машинного обучения, а использовали относительно простые алгоритмы попиксельного сравнения символа и шаблона, что давало приемлемые результаты в рамках одного шрифта.
Современные OCR-системы, использующие машинное обучение, позволяют выполнять более сложные операции: не только решать задачу омнишрифтового распознавания, но и также могут распознавать плохо читаемые тексты, распознавать текст в сложных документах (вычленять элементы форматирования, такие как таблица содержания, заголовки, колонтитулы, шрифты, стили шрифтов), распознавать рукописные тексты, обучаясь почерку отдельного человека на достаточном для обучения объеме данных.
Следующая область на рисунке (представленная вытянутым эллипсом) — это вычислительная нейробиология, область, где используются математические модели для изучения принципов, которые управляют развитием, структурой, физиологией и когнитивными способностями мозга. Вычислительная нейробиология имеет существенное пересечение с ИИ и особенно с глубоким обучением.
Цель нейронауки — понять работу мозга, и высшая цель — объяснить феномен сознания. Цель ИИ заключается в том, чтобы научить компьютеры имитировать разумное поведение, решать задачи, требующие интеллекта. Очевидно, что указанные области имеют пересечение. Информация о строении и функционировании мозга позволяет совершенствовать и создавать новые алгоритмы для решения задач из области ИИ. Наиболее ярким примером являются успехи создания моделей глубокого обучения на базе искусственных нейронных сетей. Таким образом, оба направления развиваются и обогащают друг друга. Еще одна окружность — «Обнаружение знаний в базах данных» (Knowledge Discovery in Databases KDD) — обозначает методику обнаружения полезных знаний в данных. Датамайнинг является под множеством KDD.
KDD и датамайнинг имеют существенное пересечение с машинным обучением. Датамайнинг может использовать общие методы вместе с машинным обучением. «Но если машинное обучение сосредоточено на прогнозировании, основанном на известных свойствах, полученных из обучающих данных, то датамайнинг сосредоточен на обнаружении ранее неизвестных свойств в данных, являясь этапом анализа для обнаружения знаний в KDD».
«В машинном обучении производительность обычно оценивается по способности воспроизводить известные знания, в то время как в обнаружении знаний и добыче данных ключевой задачей является обнаружение ранее неизвестных знаний. При оценке по известным знаниям неконтролируемый метод (без учителя) будет легко превзойден контролируемыми методами (с учителем), тогда как в типичной задаче KDD контролируемые методы не могут быть использованы из-за недоступности обучающих данных».
Некоторые задачи датамайнинга и машинного обучения пересекаются: классификация, кластеризация, прогнозирование, анализ и обнаружение отклонений. Для решения этих задач может применяться инструментарий машинного обучения, а может и не применяться. Например, для решения задач классификации и кластеризации могут применяться как искусственные нейронные сети, являющиеся одним из методов машинного обучения, так и другие подходы, например графическое представление информации, при том, что интеллектуальное решение принимается человеком. При этом в датамайнинге успешно применяются интерпретируемые методы машинного обучения, такие как деревья решений, по которым затем могут быть построены правила, описывающие свойства предметной области.
Вариантов применения ИИ большое множество, и не все они служат для решения задач датамайнинга. Например, обучение с учителем, при котором выполняется процесс обучения, это задача построения модели, основанной на данных, которая сможет научиться на основе размеченных данных «понять» правила, которым систему ИИ обучает учитель, и начать различать разные типы данных. При этом такая область, как распознавание речи или машинный перевод (которые были рассмотрены ранее в данной лекции), являются задачами ИИ и не являются задачами датамайнинга. Кроме того, в понятие ИИ входит целый ряд методов, основанных на явном представлении знаний и логическом выводе.
Долее рассмотрим, где происходит пересечение областей «наука о данных» (data science, дата-сайнс) и искусственный интеллект.
Термин дата-сайнс появился сравнительно недавно (в 2008 году), чтобы описать развивающуюся область исследований, направленную на выявление скрытой ценности в данных. Дата-сайнс включает в себя такие области как датамайнинг и обнаружение данных и имеет пересечение со всеми ранее перечисленными категориями.
Дата-сайнс неслучайно показан как самое большое множество, наука о данных подразумевает комплексный процесс, включающий предварительную обработку данных, их анализ, визуализацию и выработку прогнозов на основе данных. Несмотря на то, что ИИ в первую очередь ассоциируется с созданием компьютерных алгоритмов интеллектуальной обработки данных, во многих проектах по реализации ИИ могут использоваться вышеперечисленные стадии сбора и обработки данных.
Говоря о различии методов классической статистики ИИ, сошлемся на мнение авторов статьи. Они отмечают, что традиционная статистика имеет дедуктивный подход к истине (от общего к частному), и если классический статистический подход начинается с набора гипотез, то методология ИИ и машинного обучения в начале исследования не делают каких-либо предположений относительно типа поведения переменных, чтобы соотнести их с целевым результатом.
Можно ли сказать, что, применяя алгоритм линейной регрессии, известный еще в начале 19 века, вы решаете задачу машинного обучения?
Разные специалисты дадут разные ответы. Однако такие гуру машинного обучения как Кристофер Бишоп в книге «Распознавание образов и машинное обучение», Ян Гудфеллоу в книге «Глубокое обучение» и ряд других упоминают линейную регрессию как один из алгоритмов машинного обучения. Так что граница между классической статистикой и машинным обучением как областью искусственного интеллекта в некотором смысле размыта. Можно привести такую аналогию — те, кто делают колеса, создают автомобиль, но колесо не является автомобилем, и колесо появилось задолго до появления автомобиля.
Так, в классических статистических моделях за моделью стоит теория, доказанная математически, при этом необходимо, чтобы данные строго соответствовали определенным предположениям. Машинное обучение также основано на строгих математических основах, однако, оно в большей степени связано с исследованиями закономерностей в данных, которые могут проводиться эмпирическим путем. Поскольку машинное обучение часто использует итерационный подход для получения знаний, извлекаемых из данных, обучение можно легко автоматизировать. Данные обрабатываются до тех пор, пока не будет найдена надежная модель определенной точности.
Мы проследили некоторую эволюцию ИИ-технологий и, подводя итог первой лекции, хотели бы рассмотреть, как из упомянутых технологий строятся ИИ-решения, какова их структура, каков набор и иерархия входящих в эти решения технологий искусственного интеллекта. Также в этом разделе поговорим о том, как меняется спектр наиболее востребованных технологий в современных ИИ-решениях, и завершим лекцию обсуждением вопроса «Где технологии ИИ пересекаются с другими областями знания?».
На рис. 2.35 показана схема, отражающая иерархию технологий, необходимых для построения современного ИИ-решения. Во внутреннем эллипсе представлены различные алгоритмы, на основе которых строятся ИИ-решения, в частности здесь перечислены упоминаемые нами ранее алгоритмы «дерево решений», «метод опорных векторов», «генетическое программирование», «линейная регрессия», «нейронные сети».
Следующий эллипс — это уровень исследовательских методов или научных школ искусственного интеллекта, включая рассмотренные нами символизм, коннекционизм и эволюционизм.
Рис. 2.35. Уровни ИИ. Источник: Упрощенный вариант по материалам
Далее показан эллипс, демонстрирующий базовые технологические направления, которые могут быть построены на основе различных алгоритмов — это уже рассмотренные нами ранее задачи компьютерного зрения, обработки естественного языка, экспертные системы, системы поддержки принятия решений и другие. И наконец, внешний эллипс отображает области внедрения ИИ-приложений, то есть комплексные решения, в которых ИИ-компоненты обеспечивают ту или иную часть их функциональности (финансы, умный город, здравоохранение, промышленность и другие).
Для того чтобы построить решение на базе ИИ, помимо программного обеспечения нужна инфраструктура, на которой все перечисленные приложения будут работать. Причем нужна специализированная инфраструктура, которая позволит обрабатывать типичные для ИИ-задач нагрузки с оптимальной производительностью. К числу инфра-структурных технологий, на которых строятся ИИ-решения, в схеме рис. 2.35 отнесены элементы аппаратного обеспечения (процессоры, память, нейроускорители, сенсоры и датчики, системы управления движением), программное обеспечение (алгоритмы, фреймворки, библиотеки, вычислительные среды, инструменты разработки) и данные (пакетные данные, потоковые данные, большие данные, разметка).
Говоря о технологиях, составляющих то или иное комплексное решение, следует отметить, что технологии быстро развиваются — совершенствуются алгоритмы, меняются вычислительные возможности, одни технологии устаревают и сходят с дистанции, другие массово применяются большинством участников рынка, третьи применяются в пилотных проектах, четвертые находятся еще только на стадии запуска. Иными словами, для того чтобы оценить, какие технологии используются в ИИ-решении и какие будут актуальны в ближайшей перспективе, требуется еще одна точка зрения — это взгляд, связанный с анализом жизненного цикла технологии от запуска до выхода на массовый рынок. Обратимся к материалам аналитической компании Gartner, которая ежегодно публикует так называемый цикл ажиотажа (Gartner Hype Cycle), показывающий стадию развития той или иной технологии с точки зрения ее зрелости и с точки зрения ее субъективного восприятия профессиональным сообществом. В данной методике Gartner исходит из того, что каждая новация проходит пять различных стадий, представленных на рис. 2.36.
Рис. 2.36. Кривые ажиотажа Gartner за 2017, 2019, 2021 гг.
Поскольку Gartner проводит оценку ИИ-технологий ежегодно, появляется возможность показать, как рассмотренные нами выше технологии, «проходят сквозь цикл ажиотажа». Нельзя сказать, что все технологии последовательно движутся вдоль кривой с одинаковой скоростью. Некоторые, как, например, технология сильного ИИ как находились на этапе запуска, так и остаются в этом состоянии, более того — ряд ученых полагают, что этой технологии не суждено воплотиться в полной мере на практике. Другие ИИ-технологии, такие как «распознавание речи» и «использование графических ускорителей» на кривой 2021 г., уже прошли плато продуктивности и находятся за пределами цикла, третьи (такие как, например, «семантический поиск») перемещаются в сторону «плато продуктивности».
Не для всех технологий можно показать, как они продвигаются по кривой ажиотажа, поскольку не все технологии, которые были, например, в фокусе внимания компании Gartner в предшествующие годы, попадают в область рассмотрения в последующие. Некоторые просто выпадают из поля зрения аналитической компании.
Когда говорят о наборе технологий, составляющих ИИ-решение, неизбежно заходит речь о том, где проходит граница между ИИ-технологией и смежными областями. Очевидно, что ИИ-технологии имеют области пересечения с другими технологиями, имеющими отношение к наукам о данных. Различные авторы пытались показать, в какой степени область искусственного интеллекта пересекается с другими технологиями, что позволяет лучше понять предмет ИИ как области науки. Существует достаточно много попыток отобразить графически данные пересечения в виде диаграмм Венна (например, они приведены в работах). Некоторые из этих диаграмм, на наш взгляд, имеют слишком ограниченный перечень областей, другие, напротив, перегружены подробностями и теряют наглядность. Мы остановились на диаграмме, которую в своих работах использовали специалисты компании SAS Institute ( рис. 2.37).
Рис. 2.37. Пересечение областей знаний, ассоциированных с обработкой данных. Источник: SAS
Пользуясь данной схемой, обсудим, где же технологии ИИ пересекаются с другими областями знаний. Начнем рассмотрение рис. 2.37 с области, представленной окружностью в верхней части рисунка — «распознавание паттернов». Технология распознавания паттернов подразумевает использование различных алгоритмов с целью выявления закономерностей в данных как с использованием, так и без использования машинного обучения.
Например, первые OCR-системы (относящиеся к технологии распознавания образов) не применяли алгоритмы машинного обучения, а использовали относительно простые алгоритмы попиксельного сравнения символа и шаблона, что давало приемлемые результаты в рамках одного шрифта.
Современные OCR-системы, использующие машинное обучение, позволяют выполнять более сложные операции: не только решать задачу омнишрифтового распознавания, но и также могут распознавать плохо читаемые тексты, распознавать текст в сложных документах (вычленять элементы форматирования, такие как таблица содержания, заголовки, колонтитулы, шрифты, стили шрифтов), распознавать рукописные тексты, обучаясь почерку отдельного человека на достаточном для обучения объеме данных.
Следующая область на рисунке (представленная вытянутым эллипсом) — это вычислительная нейробиология, область, где используются математические модели для изучения принципов, которые управляют развитием, структурой, физиологией и когнитивными способностями мозга. Вычислительная нейробиология имеет существенное пересечение с ИИ и особенно с глубоким обучением.
Цель нейронауки — понять работу мозга, и высшая цель — объяснить феномен сознания. Цель ИИ заключается в том, чтобы научить компьютеры имитировать разумное поведение, решать задачи, требующие интеллекта. Очевидно, что указанные области имеют пересечение. Информация о строении и функционировании мозга позволяет совершенствовать и создавать новые алгоритмы для решения задач из области ИИ. Наиболее ярким примером являются успехи создания моделей глубокого обучения на базе искусственных нейронных сетей. Таким образом, оба направления развиваются и обогащают друг друга. Еще одна окружность — «Обнаружение знаний в базах данных» (Knowledge Discovery in Databases KDD) — обозначает методику обнаружения полезных знаний в данных. Датамайнинг является под множеством KDD.
KDD и датамайнинг имеют существенное пересечение с машинным обучением. Датамайнинг может использовать общие методы вместе с машинным обучением. «Но если машинное обучение сосредоточено на прогнозировании, основанном на известных свойствах, полученных из обучающих данных, то датамайнинг сосредоточен на обнаружении ранее неизвестных свойств в данных, являясь этапом анализа для обнаружения знаний в KDD».
«В машинном обучении производительность обычно оценивается по способности воспроизводить известные знания, в то время как в обнаружении знаний и добыче данных ключевой задачей является обнаружение ранее неизвестных знаний. При оценке по известным знаниям неконтролируемый метод (без учителя) будет легко превзойден контролируемыми методами (с учителем), тогда как в типичной задаче KDD контролируемые методы не могут быть использованы из-за недоступности обучающих данных».
Некоторые задачи датамайнинга и машинного обучения пересекаются: классификация, кластеризация, прогнозирование, анализ и обнаружение отклонений. Для решения этих задач может применяться инструментарий машинного обучения, а может и не применяться. Например, для решения задач классификации и кластеризации могут применяться как искусственные нейронные сети, являющиеся одним из методов машинного обучения, так и другие подходы, например графическое представление информации, при том, что интеллектуальное решение принимается человеком. При этом в датамайнинге успешно применяются интерпретируемые методы машинного обучения, такие как деревья решений, по которым затем могут быть построены правила, описывающие свойства предметной области.
Вариантов применения ИИ большое множество, и не все они служат для решения задач датамайнинга. Например, обучение с учителем, при котором выполняется процесс обучения, это задача построения модели, основанной на данных, которая сможет научиться на основе размеченных данных «понять» правила, которым систему ИИ обучает учитель, и начать различать разные типы данных. При этом такая область, как распознавание речи или машинный перевод (которые были рассмотрены ранее в данной лекции), являются задачами ИИ и не являются задачами датамайнинга. Кроме того, в понятие ИИ входит целый ряд методов, основанных на явном представлении знаний и логическом выводе.
Долее рассмотрим, где происходит пересечение областей «наука о данных» (data science, дата-сайнс) и искусственный интеллект.
Термин дата-сайнс появился сравнительно недавно (в 2008 году), чтобы описать развивающуюся область исследований, направленную на выявление скрытой ценности в данных. Дата-сайнс включает в себя такие области как датамайнинг и обнаружение данных и имеет пересечение со всеми ранее перечисленными категориями.
Дата-сайнс неслучайно показан как самое большое множество, наука о данных подразумевает комплексный процесс, включающий предварительную обработку данных, их анализ, визуализацию и выработку прогнозов на основе данных. Несмотря на то, что ИИ в первую очередь ассоциируется с созданием компьютерных алгоритмов интеллектуальной обработки данных, во многих проектах по реализации ИИ могут использоваться вышеперечисленные стадии сбора и обработки данных.
Говоря о различии методов классической статистики ИИ, сошлемся на мнение авторов статьи. Они отмечают, что традиционная статистика имеет дедуктивный подход к истине (от общего к частному), и если классический статистический подход начинается с набора гипотез, то методология ИИ и машинного обучения в начале исследования не делают каких-либо предположений относительно типа поведения переменных, чтобы соотнести их с целевым результатом.
Можно ли сказать, что, применяя алгоритм линейной регрессии, известный еще в начале 19 века, вы решаете задачу машинного обучения?
Разные специалисты дадут разные ответы. Однако такие гуру машинного обучения как Кристофер Бишоп в книге «Распознавание образов и машинное обучение», Ян Гудфеллоу в книге «Глубокое обучение» и ряд других упоминают линейную регрессию как один из алгоритмов машинного обучения. Так что граница между классической статистикой и машинным обучением как областью искусственного интеллекта в некотором смысле размыта. Можно привести такую аналогию — те, кто делают колеса, создают автомобиль, но колесо не является автомобилем, и колесо появилось задолго до появления автомобиля.
Так, в классических статистических моделях за моделью стоит теория, доказанная математически, при этом необходимо, чтобы данные строго соответствовали определенным предположениям. Машинное обучение также основано на строгих математических основах, однако, оно в большей степени связано с исследованиями закономерностей в данных, которые могут проводиться эмпирическим путем. Поскольку машинное обучение часто использует итерационный подход для получения знаний, извлекаемых из данных, обучение можно легко автоматизировать. Данные обрабатываются до тех пор, пока не будет найдена надежная модель определенной точности.