Ein Large Multimodal Model, LMM, ist ein großes generatives KI-Modell, das multimodale Informationen wie Texte, Bilder, Videos, Audioinhalte und andere Informationen sowie Kombinationen dieser verstehen, verarbeiten und generieren kann. LMMs sind eine Weiterentwicklung großer generativer Sprachmodelle (Large Language Models) und ein nächster Schritt hin zu einer Künstlichen Allgemeinen Intelligenz (Artificial General Intelligence – AGI).
Weiterlesen