„Китът вече може да вижда“: DeepSeek добавя AI визия в основен ход


Китайски стартъп с изкуствен интелект DeepSeek добави мултимодални възможности към своя водещ чатбот за първи път – което означава, че може да обработва изображения и видео в допълнение към текста – привеждайки го в съответствие с конкурентите, които вече предлагат функцията.

Ограниченото пускане за избрани потребители идва само дни след като базираната в Ханджоу компания пусна своя нов водещ модел V4, който беше последван от големи намаления на цените.

Според лидера на мултимодалния екип на DeepSeek Chen Xiaokang, който направи съобщението в сряда на X, функцията първоначално е била предложена за избиране на потребители на уебсайта на чатбота на DeepSeek и мобилното приложение за бета тестване.

„Елате да изпробвате невероятната работа на нашите гениални мултимодални колеги!“ старши изследовател Чен Дели написа на X малко след това, добавяйки, че „малкият кит вече може да вижда“, препратка към логото на кит на DeepSeek.

В интерфейса за чат на DeepSeek беше добавен нов „режим за разпознаване на изображения“ заедно с режимите за чат „експерт“ и „флаш“, които бяха въведени по-рано този месец.

Логото на DeepSeek се вижда по време на Глобалната конференция за разработчици, организирана от Шанхайската асоциация на индустрията за изкуствен интелект в Шанхай на 21 февруари 2025 г. Снимка: AFPЛогото на DeepSeek се вижда по време на Глобалната конференция за разработчици, организирана от Шанхайската асоциация на индустрията за изкуствен интелект в Шанхай на 21 февруари 2025 г. Снимка: AFP

Тъй като AI продължава бързо да напредва, мултимодалните възможности се разглеждат като необходимост за преминаване отвъд обикновените текстови разговори с потребителите към по-сложни и икономически ценни области.

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта