Nowoczesny model AI do generacji treści
CM3leon to zaawansowany model generatywny, który umożliwia zarówno generację tekstu na podstawie obrazów, jak i obrazów na podstawie tekstu. Jest to model multimodalny, który łączy funkcjonalność modeli autoregresywnych z niskimi kosztami treningu oraz efektywnością wnioskowania. Dzięki zastosowanej metodzie treningowej, CM3leon osiąga doskonałe wyniki w generacji obrazów, wykorzystując pięciokrotnie mniejsze zasoby obliczeniowe niż wcześniejsze metody oparte na transformatorach.
Model ten potrafi generować sekwencje tekstów i obrazów w oparciu o dowolne sekwencje innych treści wizualnych i tekstowych, co poszerza funkcjonalność wcześniejszych modeli. CM3leon, dzięki wzmocnieniu instrukcji dla zadań związanych z generacją obrazów i tekstów, wykazuje znaczną poprawę w takich zadaniach jak generacja opisów obrazów oraz odpowiadanie na pytania dotyczące obrazów. Osiągając nowy stan sztuki w benchmarku generacji obrazów, CM3leon jest wszechstronnym narzędziem dla różnorodnych zadań związanych z wizją i językiem.