Генеративный ИИ — это общий термин для любого вида автоматизированного процесса, использующего алгоритмы для создания, обработки или синтеза данных, часто в форме изображений или удобочитаемого текста. Это называется порождающий потому что ИИ создает то, чего раньше не было. Вот что отличает его от дискриминационный ИИ, который проводит различия между различными видами ввода. Другими словами, различающий ИИ пытается ответить на вопрос вроде «Это изображение — рисунок кролика или льва?» тогда как генеративный ИИ отвечает на такие подсказки, как «Нарисуй мне изображение льва и кролика, сидящих рядом друг с другом».

В этой статье вы познакомитесь с генеративным ИИ и его использованием с популярными моделями, такими как ChatGPT и DALL-E. Мы также рассмотрим ограничения технологии, в том числе то, почему «слишком много пальцев» стало бесполезной приманкой для искусственно созданного искусства.

Появление генеративного ИИ

Генеративный ИИ существует уже много лет, возможно, с тех пор, как ЭЛИЗА, чат-бот, который имитирует разговор с терапевтом, был разработан в Массачусетском технологическом институте в 1966 году. Но годы работы над ИИ и машинным обучением недавно увенчались успехом с выпуском новых генеративных систем ИИ. Вы почти наверняка слышали о ЧатGPTтекстовый чат-бот с искусственным интеллектом, который создает удивительно человеческую прозу. ДАЛЛ-Э и Стабильная диффузия также привлекли внимание своей способностью создавать яркие и реалистичные изображения на основе текстовых подсказок. Мы часто называем эти и подобные им системы модели потому что они представляют собой попытку смоделировать или смоделировать некоторый аспект реального мира на основе подмножества (иногда очень большого) информации о нем.

Результаты этих систем настолько сверхъестественны, что многие люди задают философские вопросы о природе сознания и беспокоятся об экономическом влиянии генеративного ИИ на рабочие места людей. Но хотя все эти творения искусственного интеллекта, несомненно, являются большими новостями, возможно, под поверхностью происходит меньше, чем некоторые могут предположить. Через мгновение мы перейдем к некоторым из этих общих вопросов. Во-первых, давайте посмотрим, что происходит под капотом таких моделей, как ChatGPT и DALL-E.

Как работает генеративный ИИ?

Генеративный ИИ использует машинное обучение для обработки огромного количества визуальных или текстовых данных, большая часть которых взята из Интернета, а затем определяет, какие вещи, скорее всего, появятся рядом с другими вещами. Большая часть работы по программированию генеративного ИИ уходит на создание алгоритмов, которые могут различать «вещи», представляющие интерес для создателей ИИ — слова и предложения в случае чат-ботов, таких как ChatGPT, или визуальные элементы для DALL-E. Но, по сути, генеративный ИИ создает свои результаты, оценивая огромный массив данных, на которых он был обучен, а затем отвечая на подсказки чем-то, что попадает в область вероятности, определяемую этим корпусом.

Автозаполнение — когда ваш мобильный телефон или Gmail предлагает, какой может быть оставшаяся часть слова или предложения, которое вы печатаете, — это низкоуровневая форма генеративного ИИ. Такие модели, как ChatGPT и DALL-E, просто доводят идею до значительно более высоких высот.



Source link