发布于 2023-11-22 15:37:43 | 阅读 12232
不久前,外界对百川智能开源模型Baichuan-7B同样提出了是否套壳LLaMa的质疑。彼时,王小川表示,搜索公司干了20年,团队对语言数据有深入的理解,知道取得高质量语料的渠道,模型迭代速度很快,“国内开源模型的能力目前已经可以达到LLaMa”。
发布于 2023-11-14 17:46:23 | 阅读 25504
你只要对着某个物品一顿拍摄,就可以给它建立 3D 模型,然后随意地拖动到「 现实 」中,任意放大缩小。
发布于 2023-11-13 14:25:21 | 阅读 11172
针对Transformer,谷歌DeepMind一项新的发现引起了不小争议:它的泛化能力,无法扩展到训练数据以外的内容。
发布于 2023-11-06 14:52:39 | 阅读 11790
Transformer模型是否能够泛化出新的认知和能力?最近,谷歌的研究人员进行了有关实验,对于这一问题给出了自己的答案。
发布于 2023-11-03 13:42:30 | 阅读 12551
在最近的一篇论文,来自西安交大、微软、北大的研究者尝试探讨了另外一种提升思路:是否可以通过逆向学习过程(即从 LLM 犯过的错误中学习)进一步提高其推理能力?
发布于 2023-10-12 14:42:17 | 阅读 11581
人工智能价值对齐 (AI alignment) 是关涉AI控制与AI安全的重要问题,随着人工智能的飞速发展和广泛应用,人工智能可能带来的风险和挑战也日益凸显,由此,“价值对齐”问题开始被广泛讨论和提及。
发布于 2023-09-01 15:25:23 | 阅读 20992
阿里智能信息事业群宣布搭载AI大模型技术的“夸克扫描王App”正式上线 ,集合高清扫描、提取文字、格式转换、去除手写笔迹、自拍证件照等20余种功能
发布于 2023-08-29 13:43:26 | 阅读 11373
Meta 于周四宣布推出一种名为 Code Llama 的大型语言模型(LLM),它可以使用文本提示来生成和讨论代码。
发布于 2023-08-21 17:59:43 | 阅读 15046
鸽了半年,稚晖君的创业首秀——人形机器人「远征 A1」终于亮相了,半年造出来的机器人,能帮我们搬砖、当保姆、搞科研。