Meta пуска най-новия си AI chatbot в мрежата, за да може обществеността да говори с него

Изследователските лаборатории на Meta за изкуствен интелект създадоха нов модерен чатбот и позволяват на членовете на обществеността да говорят със системата, за да съберат обратна връзка за нейните възможности.

Ботът се казва BlenderBot 3 и може да бъде достъпен в мрежата. (Въпреки че в момента изглежда, че само жителите на САЩ могат да го правят.) BlenderBot 3 е в състояние да участва в общ чат, казва Мета, но също така да отговаря на въпросите, които може да зададете на дигитален асистент, „от говорене за здравословно рецепти за храна, за да намерите подходящи за деца удобства в града.“

Ботът е прототип и е изграден върху този на Meta предишна работа с това, което е известно като големи езикови модели или LLMS – мощен, но недостатъчен софтуер за генериране на текст, чийто GPT-3 на OpenAI е най-известният пример. Подобно на всички LLMs, BlenderBot първоначално се обучава на огромни масиви от текст, които копае за статистически модели, за да генерира език. Такива системи са се доказали като изключително гъвкави и са използвани за различни приложения, от генериране на код за програмисти че помага на авторите да напишат следващия си бестселър. Тези модели обаче имат и сериозни недостатъци: те повръщане на пристрастия в техните данни за обучение и често измислете отговори на въпросите на потребителите (голям проблем, ако ще бъдат полезни като цифрови асистенти).

Последният проблем е нещо, което Meta специално иска да тества с BlenderBot. Голяма характеристика на чатбота е, че той може да търси в интернет, за да говори по конкретни теми. Още по-важното е, че след това потребителите могат да кликнат върху неговите отговори, за да видят откъде е получил информацията. BlenderBot 3, с други думи, може да цитира своите източници.

Пускайки чатбота за широката публика, Meta иска да събере обратна връзка за различните проблеми, пред които са изправени големите езикови модели. Потребителите, които разговарят с BlenderBot, ще могат да маркират всякакви подозрителни отговори от системата, а Meta казва, че е работило усилено, за да „минимизира използването на вулгарен език, обиди и културно нечувствителни коментари от ботовете“. Потребителите ще трябва да се включат, за да се събират техните данни и ако е така, техните разговори и обратна връзка ще бъдат съхранени и по-късно публикувани от Meta, за да бъдат използвани от общата изследователска общност на AI.

„Ние се ангажираме да публикуваме публично всички данни, които събираме в демонстрацията, с надеждата, че можем да подобрим разговорния AI“, каза Кърт Шустър, изследователски инженер в Meta, който помогна за създаването на BlenderBot 3 На ръба.

Примерен разговор с BlenderBot 3 в мрежата. Потребителите могат да дават обратна връзка и реакции на конкретни отговори.
Изображение: Мета

Пускането на обществеността на прототипи на чатботове с изкуствен интелект исторически е било рисковано действие за технологичните компании. През 2016 г. Microsoft пусна чатбот на име Tay в Twitter, който се учи от взаимодействието си с обществеността. Донякъде предсказуемо, потребителите на Twitter скоро научиха Тей да повръща редица расистки, антисемитски и женомразки изявления. В отговор Microsoft извади бота офлайн по-малко от 24 часа по-късно.

Мета казва, че светът на ИИ се е променил много след неизправността на Тей и че BlenderBot има всякакви предпазни релси, които трябва да попречат на Мета да повтори грешките на Microsoft.

Най-важното, казва Мери Уилямсън, мениджър по инженерни изследвания във Facebook AI Research (FAIR), докато Tay е проектиран да се учи в реално време от потребителските взаимодействия, BlenderBot е статичен модел. Това означава, че е в състояние да запомни какво казват потребителите в рамките на разговор (и дори ще запази тази информация чрез бисквитки на браузъра, ако потребителят излезе от програмата и се върне по-късно), но тези данни ще се използват само за подобряване на системата по-нататък.

„Това е само мое лично мнение, но това [Tay] епизодът е сравнително жалък, защото създаде тази зима на чатботовете, в която всяка институция се страхуваше да пусне публични чатботове за изследване“, казва Уилямсън На ръба.

Уилямсън казва, че повечето използвани днес чатботове са тесни и ориентирани към задачи. Помислете например за ботове за обслужване на клиенти, които често просто представят на потребителите предварително програмирано диалогово дърво, стеснявайки заявката им, преди да ги предадат на човешки агент, който всъщност може да свърши работата. Истинската награда е изграждането на система, която може да води разговор толкова свободен и естествен като човешкия, а Мета казва, че единственият начин да се постигне това е да се позволи на ботовете да водят свободни и естествени разговори.

„Тази липса на толерантност към ботовете, които казват безполезни неща, в широкия смисъл на думата, е жалко“, казва Уилямсън. „И това, което се опитваме да направим, е да пуснем това много отговорно и да тласнем изследванията напред.“

В допълнение към пускането на BlenderBot 3 в мрежата, Meta също го прави публикуване на основния код, набор от данни за обучение и по-малки варианти на модела. Изследователите могат да поискат достъп до най-големия модел, който има 175 милиарда параметри, чрез формуляр тук.