“I”:视频输入。GPT-4V对视频的理解还相当原始,因为它将视频视为一系列离散图像。减少信息冗余的最聪明方法是什么?学习目标应该是什么?下一帧预测与下一个单词预测有着明显的类比关系,但它是否是最佳的?如何与语言交错?如何引导机器人和人工智能的视频学习?业界尚未达成共识。
到2024年,我们将看到更多实时图像、音频和视频生成传播应用。
事实上,椰树直播爆火背后也来自一支年轻的专业团队。据了解,椰树背后的背后的直播负责人是一个90后女生,操盘公司也只有二三十人,专为椰树直播而聚集。
别急,已经在进步了。
2017年,新墨西哥州洛斯阿拉莫斯国家实验室的Paul Johnson开始使用机器学习来理解地震的数据。他建立了一个人工模拟地震的实验室,用各种方法来模拟地震。