MM-LLMs: Recent Advances in MultiModal Large Language Models
- 2022年以降に登場したマルチモーダルモデル(MMM)の包括的なサーベイを行い,122個のMMMについてベンチマークを行った
- ベンチマークからMMMの効率的なトレーニング方法をまとめ,リアルタイムで最新動向を管理するウェブサイトを公開
Mar 12, 2024 multi modal model arXiv (2024)
2019.04 - 2023.03: 岐阜大学 工学部 電気電子・情報工学科 情報コース
2023.04 - 現在: 岐阜大学大学院 自然科学研究科 知能理工学専攻 知能情報学領域
2019.04 - 2023.03: Bachelor of Engineering. Department of Information Science, Faculty of Engineering, Gifu University
2023.04 - current: Master of Engineering, Department of Information Science, Graduate School of Engineering, Gifu University
〒501-1193
岐阜県岐阜市柳戸1-1
岐阜大学 工学部 電気電子・情報工学科 加藤研究室
上野 詩翔, 山田 悠正(岐阜大学), 中塚 俊介(岐阜大学, パナソニック), 加藤 邦人(岐阜大学), "深層能動学習におけるクエリ戦略の有効性調査", 第26回 画像の認識・理解シンポジウム MIRU2023, IS2-45, 2023.7.27
上野 詩翔, 加藤 邦人(岐阜大学), "Web上の類似画像検索と多様性クエリ戦略の組み合わせによる表現学習の性能向上", パターン認識・メディア理解研究会(PRMU), 1A-3, 2023.11.16
山田 悠正, 尾下 拓未, 中塚 俊介, 加藤 邦人, 上野 詩翔, 相澤 宏旭, 林 良和:"大規模視覚言語モデルのIn-Context Learningによる少量データからの外観検査", ビジョン技術の実利用ワークショップ ViEW2023, OS3-H3, pp.344-351, 2023.12.8.
上野 詩翔, 尾下 拓未, 中塚 俊介, 加藤 邦人, 林 良和, 相澤 宏旭:"大規模視覚言語モデルによる少量データからの汎用外観検査 ー画像と言語の対応関係が学習に与える影響ー", SSII 2024 投稿中
Yusei Yamada, Shiryu Ueno, Takumi Oshita, Shunsuke Nakatsuka and Kunihito Kato:"ACL: Active Curriculum Learning to Reduce Labeling Efforts", Proceedings of the International Conference on Quality Control by Artificial Vision 2023 (QCAV2023),2023.6.8
Candra Dewi, Shiryu Ueno and Kunihito Kato:"Artificially Ripeness Identification of Indonesian Banana Cultivar Using Convolution Neural Network", SIET 2023 accepted.
加藤邦人, 山田悠正, 尾下拓未, 中塚俊介, 上野詩翔, 相澤宏旭, 林良和, "大規模視覚言語モデルによる外観検査方法"(特許2023-201449/2023.11.29出願)
山田 悠正, 上野 詩翔, 尾下 拓未, 中塚 俊介, 加藤 邦人:"能動カリキュラム学習によるアノテーション効率化",日本興業出版「画像ラボ」Vol.34, No.7, pp.1-7(2023,7)
Shiryu Ueno, Yusei Yamada, Shunsuke Nakatsuka and Kunihito Kato:"Benchmarking of Query Strategies: Towards Future Deep Active Learning", arXiv, 2023.12.12.