type
status
date
slug
summary
tags
category
icon
password
Last edited time
Nov 7, 2024 01:21 PM
📝 主旨内容
开幕式
报告
Exploring the New Frontiers of AI – ByteDance Research's Exploration
字节跳动AI实验室:
- Robotic
- AI for Science
- Responsible AI
- AI Foundation: Large AI Models
蛋白质建模与设计 —— CryoFM,DPLM,DPLM2
DPLM-2是一种多模态蛋白模型,通过联合序列和结构生成,提高了蛋白质建模效率和精度
dplm
bytedance • Updated Nov 11, 2024
机器人 —— GR-1,GR-2
GR-2通过视频生成预训练和机器人数据微调,实现多视角条件下的视觉操控
GR-1
bytedance • Updated Nov 11, 2024
端到端同声传译 —— CLASI(Cross Language Agent – Simultaneous Interpretation)
通过处理当前音频输入,结合外部知识检索和历史上下文信息,实时生成高质量的翻译。
视频生成 —— PixelDance
细粒度多模态场景理解与生成
基于大模型的神经符号计算
大模型检索增强
报告内容
- 通用文本表征特征
- 学习索引
- RAG
FlexRAG通过压缩上下文嵌入,提升生成质量并降低成本,实现灵活高效的RAG系统
海报
Vision-Language Dual-Pattern Matching for Out-of-Distribution Detection
提出MCM方法,将OOD检测从单模态扩展到多模态,显著提升检测性能
顶会回顾
ICLR——北京大学 袁粒
拒稿
转投CVPR oral
ECCV2024——重庆大学
3D视觉
复杂分割 华为火花奖
🤗 总结归纳
📎 参考文章
- 作者:ziuch
- 链接:https://ziuch.com/article/MLA2024
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。