正在加载…
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
AGI
通用人工智能
拒绝采样(Rejection Sampling)
《语言模型之谜:提示内容与格式的交响诗》
《追逐智慧星辰:动态低秩自适应的奇幻旅程》
最优传输革命:从蒙日问题到AI思维的统一场论
《输运革命:当神经网络遇见宇宙演化的最小成本法则》
《星河秘语:自回归与修正流的奇幻交响曲》
《探索智能演化:GRPO训练在GRPO Llama-1B上的绚丽实验之旅》
穿越影像模态的奇妙之旅:从合成数据到真实应用的图像匹配革命
《6美元炼就未来——李飞飞领衔,低成本打爆 DeepSeek!》
基于最优输运思想的分组奖励策略优化算法详解
探秘 OmniHuman:多模态条件下的视频生成黑科技
从响应奖励到过程奖励:隐式PRM的幽默进阶之旅
DeepSeek 的三重门:从小天才到哲学家的创新之旅
《深度学习的整数化:原理与实践》
🌟 深度学习中整数量化的完整实现解析
🌟《二值连接:深度神经网络的轻量级革命》
🧠《智者的进化:解密 GRPO 算法的奥秘》
🌌 《GPT-5的传言:改变一切的背后故事》
🔍 解密思维的迷宫:Search-o1 如何让 AI 像侦探一样思考
深入探讨 DeepSeek-R1:强化学习的全新视角
« 上一页
下一页 »
沪ICP备2024052574号-2