Как обучить своего чат-бота с помощью быстрого проектирования

Лукас Мериан

Старший репортер, Computerworld |

Одна из причин, по которой чат-боты на основе искусственного интеллекта в последние месяцы покорили мир, заключается в том, что они могут генерировать или обрабатывать текст для различных целей, будь то создание рекламной кампании или написание резюме.

Эти чат-боты основаны на алгоритмах большой языковой модели (LLM), которые могут имитировать человеческий интеллект и создавать текстовый контент, а также аудио, видео, изображения и компьютерный код. LLM — это тип искусственного интеллекта, обученный на огромном количестве статей, книг или интернет-ресурсов и других данных для создания человеческих реакций на вводимые данные на естественном языке.

Все большее число технологических компаний представляют инструменты генеративного искусственного интеллекта на основе LLM для использования в бизнесе для автоматизации прикладных задач. Например, на прошлой неделе Microsoft представила ограниченному числу пользователей чат-бота на основе ChatGPT OpenAI; он встроен в Microsoft 365 и может автоматизировать функции приложений CRM и ERP.

Пример генеративного ИИ, создающего программный код с помощью командной строки пользователя. В этом случае чат-бот Эйнштейна от Salesforce активируется за счет использования большой языковой модели OpenAI GPT-3.5.

Например, новый Microsoft 365 Copilot можно использовать в Word для создания первого черновика документа, что потенциально сэкономит часы времени на написание, поиск и редактирование. Salesforce также объявила о планах выпустить чат-бота на основе GPT для использования со своей CRM-платформой.

Большинство LLM, таких как GPT-4 от OpenAI, предварительно обучены как механизмы прогнозирования следующего слова или контента — именно так большинство компаний используют их, так сказать, «из коробки». И хотя чат-боты на основе LLM допустили свою долю ошибок, предварительно обученные LLM относительно хорошо работают, предоставляя в основном точный и убедительный контент, который, по крайней мере, можно использовать в качестве отправной точки.

Однако во многих отраслях требуются более специализированные алгоритмы LLM, которые понимают их жаргон и создают контент, специфичный для своих пользователей. Например, магистрантам в сфере здравоохранения может потребоваться обработка и интерпретация электронных медицинских записей (EHR), предложение лечения или создание сводной информации о состоянии здоровья пациента на основе заметок врача или голосовых записей. LLM, ориентированный на индустрию финансовых услуг, может суммировать звонки о доходах, создавать стенограммы встреч и выполнять анализ мошенничества для защиты потребителей.

В различных отраслях обеспечение высокой степени точности реагирования может иметь первостепенное значение.

Доступ к большинству LLM можно получить через интерфейс прикладного программирования (API), который позволяет пользователю создавать параметры или корректировать реакцию LLM. Вопрос или запрос, отправленный чат-боту, называется подсказкой, поскольку пользователь запрашивает ответ. Подсказками могут быть вопросы на естественном языке, фрагменты кода или команды, но для того, чтобы LMM точно выполнял свою работу, подсказки должны быть точными.

И эта необходимость породила новый навык: оперативное проектирование.

Оперативное проектирование — это процесс создания и оптимизации текстовых подсказок для больших языковых моделей для достижения желаемых результатов. «[Он] помогает специалистам LLM быстро итерировать прототипирование и исследование продукта, поскольку он адаптирует LLM для быстрого и легкого согласования с определением задачи», — сказал Маршалл Чой, старший вице-президент по продуктам SambaNova Systems, стартапа из Кремниевой долины, который производит полупроводники для искусственного интеллекта (ИИ).

По словам Эно Рейеса, инженера по машинному обучению Hugging Face, платформы, управляемой сообществом, которая создает и размещает LLM, возможно, что не менее важно для пользователей, быстрое проектирование станет жизненно важным навыком для ИТ-специалистов и бизнес-специалистов.

« Многие люди, которых я знаю в сфере программного обеспечения, информационных технологий и консалтинга, постоянно используют оперативное проектирование в своей личной работе», — сказал Рейес в ответе по электронной почте Computerworld. «Поскольку LLM все больше интегрируется в различные отрасли, их потенциал для повышения производительности огромен».