
Китайски стартъп с изкуствен интелект DeepSeek добави мултимодални възможности към своя водещ чатбот за първи път – което означава, че може да обработва изображения и видео в допълнение към текста – привеждайки го в съответствие с конкурентите, които вече предлагат функцията.
Ограниченото пускане за избрани потребители идва само дни след като базираната в Ханджоу компания пусна своя нов водещ модел V4, който беше последван от големи намаления на цените.
Според лидера на мултимодалния екип на DeepSeek Chen Xiaokang, който направи съобщението в сряда на X, функцията първоначално е била предложена за избиране на потребители на уебсайта на чатбота на DeepSeek и мобилното приложение за бета тестване.
„Елате да изпробвате невероятната работа на нашите гениални мултимодални колеги!“ старши изследовател Чен Дели написа на X малко след това, добавяйки, че „малкият кит вече може да вижда“, препратка към логото на кит на DeepSeek.
В интерфейса за чат на DeepSeek беше добавен нов „режим за разпознаване на изображения“ заедно с режимите за чат „експерт“ и „флаш“, които бяха въведени по-рано този месец.
Логото на DeepSeek се вижда по време на Глобалната конференция за разработчици, организирана от Шанхайската асоциация на индустрията за изкуствен интелект в Шанхай на 21 февруари 2025 г. Снимка: AFP
Тъй като AI продължава бързо да напредва, мултимодалните възможности се разглеждат като необходимост за преминаване отвъд обикновените текстови разговори с потребителите към по-сложни и икономически ценни области.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта
