Alibaba, крупнейшая китайская компания в области электронной коммерции, представила новые модели генеративного ИИ, которые способны распознавать изображения и выполнять более сложные взаимодействия, чем предыдущие продукты компании.
Две новые модели, Qwen-VL и Qwen-VL-Chat, предназначенные для генеративного ИИ, имеют открытый исходный код, поэтому другие разработчики могут использовать их для создания собственных генеративных ИИ-приложений без необходимости обучения собственных систем, что экономит время и средства.
По данным Alibaba, Qwen-VL может отвечать на открытые вопросы пользователей, связанные с различными изображениями, и генерировать подписи к фотографиям. Модель может сравнивать несколько изображений и отвечать на несколько вопросов одновременно. Она также может писать рассказы, создавать изображения из фотографий и решать уравнения. Компания приводит пример, когда Qwen-VL-Chat по вывеске определяет, на каком этаже здания находится то или иное отделение больницы.