社区
首页
集团介绍
社区
资讯
行情
学堂
TigerGPT
登录
注册
零度可口不可乐
IP属地:海外
+关注
帖子 · 5
帖子 · 5
关注 · 0
关注 · 0
粉丝 · 0
粉丝 · 0
零度可口不可乐
零度可口不可乐
·
02-20
割韭菜
苹果发布iPhone 16e,搭载A18芯片,支持Apple Intelligence
售价599美元起。
苹果发布iPhone 16e,搭载A18芯片,支持Apple Intelligence
看
307
回复
评论
点赞
点赞
编组 21备份 2
分享
举报
零度可口不可乐
零度可口不可乐
·
02-13
不是说和阿里合作吗?
市场消息:苹果仍在与百度合作,在中国开发人工智能技术用于iPhone
2月12日,$百度(BIDU)$盘前拉升逾4%!市场消息:$苹果(AAPL)$仍在与百度合作,在中国开发人工智能技术用于iPhone。
市场消息:苹果仍在与百度合作,在中国开发人工智能技术用于iPhone
看
475
回复
1
点赞
点赞
编组 21备份 2
分享
举报
零度可口不可乐
零度可口不可乐
·
01-26
评论区太经典了
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
就在这当口,全球复现DeepSeek的一波狂潮也来了。更令人兴奋的是,成本不到30美金,就可以亲眼见证「啊哈」时刻。7B模型复刻,结果令人惊讶港科大助理教授何俊贤的团队,只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练。与DeepSeek R1类似,研究者的强化学习方案极其简单,没有使用奖励模型或MCTS类技术。随后,生成长度开始再次增加,此时出现了自我反思机制。
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
看
471
回复
评论
点赞
5
编组 21备份 2
分享
举报
零度可口不可乐
零度可口不可乐
·
2024-02-09
@David159
好运常伴
看
762
回复
评论
点赞
点赞
编组 21备份 2
分享
举报
加载更多
暂无关注
热议股票
{"i18n":{"language":"zh_CN"},"isCurrentUser":false,"userPageInfo":{"id":"4148800825238972","uuid":"4148800825238972","gmtCreate":1685697713888,"gmtModify":1694594771451,"name":"零度可口不可乐","pinyin":"ldkkbkllingdukekoubukele","introduction":"","introductionEn":"","signature":"","avatar":"https://static.tigerbbs.com/7e2ca30d6c5566f087ae79b4937f0846","hat":null,"hatId":null,"hatName":null,"vip":1,"status":2,"fanSize":0,"headSize":3,"tweetSize":5,"questionSize":0,"limitLevel":999,"accountStatus":1,"level":{"id":0,"name":"","nameTw":"","represent":"","factor":"","iconColor":"","bgColor":""},"themeCounts":0,"badgeCounts":0,"badges":[],"moderator":false,"superModerator":false,"manageSymbols":null,"badgeLevel":null,"boolIsFan":false,"boolIsHead":false,"favoriteSize":1,"symbols":null,"coverImage":null,"realNameVerified":null,"userBadges":[{"badgeId":"e50ce593bb40487ebfb542ca54f6a561-1","templateUuid":"e50ce593bb40487ebfb542ca54f6a561","name":"出道虎友","description":"加入老虎社区500天","bigImgUrl":"https://static.tigerbbs.com/0e4d0ca1da0456dc7894c946d44bf9ab","smallImgUrl":"https://static.tigerbbs.com/0f2f65e8ce4cfaae8db2bea9b127f58b","grayImgUrl":"https://static.tigerbbs.com/c5948a31b6edf154422335b265235809","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2024.10.15","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1001},{"badgeId":"35ec162348d5460f88c959321e554969-1","templateUuid":"35ec162348d5460f88c959321e554969","name":"精英交易员","description":"证券或期货账户累计交易次数达到30次","bigImgUrl":"https://static.tigerbbs.com/ab0f87127c854ce3191a752d57b46edc","smallImgUrl":"https://static.tigerbbs.com/c9835ce48b8c8743566d344ac7a7ba8c","grayImgUrl":"https://static.tigerbbs.com/76754b53ce7a90019f132c1d2fbc698f","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2024.03.23","exceedPercentage":"60.17%","individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1100},{"badgeId":"976c19eed35f4cd78f17501c2e99ef37-1","templateUuid":"976c19eed35f4cd78f17501c2e99ef37","name":"博闻投资者","description":"累计交易超过10只正股","bigImgUrl":"https://static.tigerbbs.com/e74cc24115c4fbae6154ec1b1041bf47","smallImgUrl":"https://static.tigerbbs.com/d48265cbfd97c57f9048db29f22227b0","grayImgUrl":"https://static.tigerbbs.com/76c6d6898b073c77e1c537ebe9ac1c57","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2024.01.21","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1102},{"badgeId":"518b5610c3e8410da5cfad115e4b0f5a-1","templateUuid":"518b5610c3e8410da5cfad115e4b0f5a","name":"实盘交易者","description":"完成一笔实盘交易","bigImgUrl":"https://static.tigerbbs.com/2e08a1cc2087a1de93402c2c290fa65b","smallImgUrl":"https://static.tigerbbs.com/4504a6397ce1137932d56e5f4ce27166","grayImgUrl":"https://static.tigerbbs.com/4b22c79415b4cd6e3d8ebc4a0fa32604","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":1,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2023.10.13","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1100}],"userBadgeCount":4,"currentWearingBadge":{"badgeId":"518b5610c3e8410da5cfad115e4b0f5a-1","templateUuid":"518b5610c3e8410da5cfad115e4b0f5a","name":"实盘交易者","description":"完成一笔实盘交易","bigImgUrl":"https://static.tigerbbs.com/2e08a1cc2087a1de93402c2c290fa65b","smallImgUrl":"https://static.tigerbbs.com/4504a6397ce1137932d56e5f4ce27166","grayImgUrl":"https://static.tigerbbs.com/4b22c79415b4cd6e3d8ebc4a0fa32604","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":1,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2023.10.13","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1100},"individualDisplayBadges":null,"crmLevel":4,"crmLevelSwitch":1,"location":"海外","starInvestorFollowerNum":0,"starInvestorFlag":false,"starInvestorOrderShareNum":0,"subscribeStarInvestorNum":0,"ror":null,"winRationPercentage":null,"showRor":false,"investmentPhilosophy":null,"starInvestorSubscribeFlag":false},"page":1,"watchlist":null,"tweetList":[{"id":405432355655808,"gmtCreate":1740007014650,"gmtModify":1740007017014,"author":{"id":"4148800825238972","authorId":"4148800825238972","name":"零度可口不可乐","avatar":"https://static.tigerbbs.com/7e2ca30d6c5566f087ae79b4937f0846","crmLevel":4,"crmLevelSwitch":1,"followedFlag":false,"idStr":"4148800825238972","authorIdStr":"4148800825238972"},"themes":[],"htmlText":"割韭菜","listText":"割韭菜","text":"割韭菜","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/405432355655808","repostId":"1181650138","repostType":2,"repost":{"id":"1181650138","kind":"news","pubTimestamp":1739981517,"share":"https://www.laohunote.com/m/news/1181650138?lang=&edition=full","pubTime":"2025-02-20 00:11","market":"us","language":"zh","title":"苹果发布iPhone 16e,搭载A18芯片,支持Apple Intelligence","url":"https://stock-news.laohu8.com/highlight/detail?id=1181650138","media":"新浪科技","summary":"售价599美元起。","content":"<html><head></head><body><p>北京时间2月20日凌晨,苹果发布iPhone 16e,这款设备是iPhone 16系列中价格最亲民的成员,具备强大的性能和出色的性价比。</p><p></p><p><img src=\"https://static.tigerbbs.com/2babc523ea5069cf562296cb4cded91f\" alt=\"\"/>据悉,全新的iPhone 16e不仅搭载了A18芯片以及iOS 18,还成为苹果首款搭载自研5G芯片的手机。</p><p style=\"text-align: start;\">iPhone 16e搭载Apple最新一代 A18 芯片,且支持Apple智能。6核中央处理器比iPhone 11搭载的A13仿生芯片快最多80%,4核图形处理器驱动惊人图像性能表现,支持对图形性能要求极高的AAA大作,且具备硬件加速光线追踪功能。16核神经网络引擎针对生成式大模型优化,运行机器学习(ML)模型速度比 A13 仿生芯片快最多6倍。</p><p style=\"text-align: start;\">此外,内置的C1是首款Apple设计的调制解调器,号称具备快速稳定的5G蜂窝网络连接性。包括C1在内的 Apple 芯片、全新内部设计与iOS 18的先进电源管理相结合,在电池续航方面有更好表现。</p><p style=\"text-align: start;\">iOS 18为iPhone 16e提供了更丰富的自定义选项,用户可以为应用和小组件选择深色或色调外观,并自由布局主屏幕的任意空间。此外,锁定屏幕底部的控制按钮支持自定义设置,而重新设计的控制中心则让用户能够更便捷地调用日常操作,包括第三方应用中的功能。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/1594e65539eb5ac97bec4985f877c2bc\" title=\"\" tg-width=\"2122\" tg-height=\"2242\"/></p><p style=\"text-align: start;\">在隐私保护方面,iOS 18新增了锁定与隐藏应用的功能,以保护敏感应用及其内部信息。</p><p style=\"text-align: start;\">在通讯功能上,iOS 18也进行了多项更新。信息应用新增了文字效果功能,可让文字内容更加生动;点回功能扩展至表情符号和贴纸,用户还可设置定时发送信息。此外,向非Apple设备用户发送信息时,信息应用支持RCS技术,提供比传统短信和彩信更丰富的媒体内容和更可靠的群消息功能。</p><p>iPhone16e售价599美元起;预订将于2月21日开始,产品将于2月28日上市。</p><p>截至发稿,苹果股价跌幅有所收窄。</p><p></p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/1bd80933fb48ab47dae1f99c132e40b5\" title=\"\" tg-width=\"560\" tg-height=\"240\"/></p></body></html>","source":"sina_tech","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>苹果发布iPhone 16e,搭载A18芯片,支持Apple Intelligence</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n苹果发布iPhone 16e,搭载A18芯片,支持Apple Intelligence\n</h2>\n\n<h4 class=\"meta\">\n\n\n2025-02-20 00:11 北京时间 <a href=https://finance.sina.com.cn/stock/usstock/c/2025-02-20/doc-inekzzct4395250.shtml><strong>新浪科技</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>北京时间2月20日凌晨,苹果发布iPhone 16e,这款设备是iPhone 16系列中价格最亲民的成员,具备强大的性能和出色的性价比。据悉,全新的iPhone 16e不仅搭载了A18芯片以及iOS 18,还成为苹果首款搭载自研5G芯片的手机。iPhone 16e搭载Apple最新一代 A18 芯片,且支持Apple智能。6核中央处理器比iPhone 11搭载的A13仿生芯片快最多80%,4核图形...</p>\n\n<a href=\"https://finance.sina.com.cn/stock/usstock/c/2025-02-20/doc-inekzzct4395250.shtml\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/b96382e1320a8e2ef1e0643c96870e5d","relate_stocks":{"AAPL":"苹果"},"source_url":"https://finance.sina.com.cn/stock/usstock/c/2025-02-20/doc-inekzzct4395250.shtml","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1181650138","content_text":"北京时间2月20日凌晨,苹果发布iPhone 16e,这款设备是iPhone 16系列中价格最亲民的成员,具备强大的性能和出色的性价比。据悉,全新的iPhone 16e不仅搭载了A18芯片以及iOS 18,还成为苹果首款搭载自研5G芯片的手机。iPhone 16e搭载Apple最新一代 A18 芯片,且支持Apple智能。6核中央处理器比iPhone 11搭载的A13仿生芯片快最多80%,4核图形处理器驱动惊人图像性能表现,支持对图形性能要求极高的AAA大作,且具备硬件加速光线追踪功能。16核神经网络引擎针对生成式大模型优化,运行机器学习(ML)模型速度比 A13 仿生芯片快最多6倍。此外,内置的C1是首款Apple设计的调制解调器,号称具备快速稳定的5G蜂窝网络连接性。包括C1在内的 Apple 芯片、全新内部设计与iOS 18的先进电源管理相结合,在电池续航方面有更好表现。iOS 18为iPhone 16e提供了更丰富的自定义选项,用户可以为应用和小组件选择深色或色调外观,并自由布局主屏幕的任意空间。此外,锁定屏幕底部的控制按钮支持自定义设置,而重新设计的控制中心则让用户能够更便捷地调用日常操作,包括第三方应用中的功能。在隐私保护方面,iOS 18新增了锁定与隐藏应用的功能,以保护敏感应用及其内部信息。在通讯功能上,iOS 18也进行了多项更新。信息应用新增了文字效果功能,可让文字内容更加生动;点回功能扩展至表情符号和贴纸,用户还可设置定时发送信息。此外,向非Apple设备用户发送信息时,信息应用支持RCS技术,提供比传统短信和彩信更丰富的媒体内容和更可靠的群消息功能。iPhone16e售价599美元起;预订将于2月21日开始,产品将于2月28日上市。截至发稿,苹果股价跌幅有所收窄。","news_type":1},"isVote":1,"tweetType":1,"viewCount":307,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0},{"id":403185137582280,"gmtCreate":1739452684041,"gmtModify":1739452685480,"author":{"id":"4148800825238972","authorId":"4148800825238972","name":"零度可口不可乐","avatar":"https://static.tigerbbs.com/7e2ca30d6c5566f087ae79b4937f0846","crmLevel":4,"crmLevelSwitch":1,"followedFlag":false,"idStr":"4148800825238972","authorIdStr":"4148800825238972"},"themes":[],"htmlText":"不是说和阿里合作吗?","listText":"不是说和阿里合作吗?","text":"不是说和阿里合作吗?","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":1,"repostSize":0,"link":"https://laohu8.com/post/403185137582280","repostId":"1112813544","repostType":2,"repost":{"id":"1112813544","kind":"news","weMediaInfo":{"introduction":"为用户提供金融资讯、行情、数据,旨在帮助投资者理解世界,做投资决策。","home_visible":1,"media_name":"老虎资讯综合","id":"102","head_image":"https://static.tigerbbs.com/8274c5b9d4c2852bfb1c4d6ce16c68ba"},"pubTimestamp":1739452562,"share":"https://www.laohunote.com/m/news/1112813544?lang=&edition=full","pubTime":"2025-02-13 21:16","market":"us","language":"zh","title":"市场消息:苹果仍在与百度合作,在中国开发人工智能技术用于iPhone","url":"https://stock-news.laohu8.com/highlight/detail?id=1112813544","media":"老虎资讯综合","summary":"2月12日,$百度(BIDU)$盘前拉升逾4%!市场消息:$苹果(AAPL)$仍在与百度合作,在中国开发人工智能技术用于iPhone。","content":"<html><head></head><body><p>2月12日,<a href=\"https://laohu8.com/S/BIDU\">百度</a>盘前拉升逾4%!市场消息:<a href=\"https://laohu8.com/S/AAPL\">苹果</a>仍在与百度合作,在中国开发人工智能技术用于iPhone。</p><p>据The Information报道,两位熟悉情况的人士透露,尽管苹果公司已与新合作伙伴阿里巴巴集团达成合作,但仍在与百度共同开发中国iPhone用户的人工智能功能。具体来说,百度一直在开发一种能处理图片和文本的人工智能搜索功能,并对中文版Siri语音助手进行升级。这些功能是“Apple Intelligence”的功能套件的一部分。苹果与百度以及阿里巴巴的合作显示了该公司通过与多家AI合作伙伴签订非独占协议来降低风险。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/acb54cbd9b4dab94a6690f64080fe281\" title=\"\" tg-width=\"864\" tg-height=\"829\"/></p></body></html>","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>市场消息:苹果仍在与百度合作,在中国开发人工智能技术用于iPhone</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n市场消息:苹果仍在与百度合作,在中国开发人工智能技术用于iPhone\n</h2>\n\n<h4 class=\"meta\">\n\n\n<a class=\"head\" href=\"https://laohu8.com/wemedia/102\">\n\n\n<div class=\"h-thumb\" style=\"background-image:url(https://static.tigerbbs.com/8274c5b9d4c2852bfb1c4d6ce16c68ba);background-size:cover;\"></div>\n\n<div class=\"h-content\">\n<p class=\"h-name\">老虎资讯综合 </p>\n<p class=\"h-time\">2025-02-13 21:16</p>\n</div>\n\n</a>\n\n\n</h4>\n\n</header>\n<article>\n<html><head></head><body><p>2月12日,<a href=\"https://laohu8.com/S/BIDU\">百度</a>盘前拉升逾4%!市场消息:<a href=\"https://laohu8.com/S/AAPL\">苹果</a>仍在与百度合作,在中国开发人工智能技术用于iPhone。</p><p>据The Information报道,两位熟悉情况的人士透露,尽管苹果公司已与新合作伙伴阿里巴巴集团达成合作,但仍在与百度共同开发中国iPhone用户的人工智能功能。具体来说,百度一直在开发一种能处理图片和文本的人工智能搜索功能,并对中文版Siri语音助手进行升级。这些功能是“Apple Intelligence”的功能套件的一部分。苹果与百度以及阿里巴巴的合作显示了该公司通过与多家AI合作伙伴签订非独占协议来降低风险。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/acb54cbd9b4dab94a6690f64080fe281\" title=\"\" tg-width=\"864\" tg-height=\"829\"/></p></body></html>\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/74282bcfe2e1d6d1ec4546eb18e35028","relate_stocks":{},"source_url":"","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1112813544","content_text":"2月12日,百度盘前拉升逾4%!市场消息:苹果仍在与百度合作,在中国开发人工智能技术用于iPhone。据The Information报道,两位熟悉情况的人士透露,尽管苹果公司已与新合作伙伴阿里巴巴集团达成合作,但仍在与百度共同开发中国iPhone用户的人工智能功能。具体来说,百度一直在开发一种能处理图片和文本的人工智能搜索功能,并对中文版Siri语音助手进行升级。这些功能是“Apple Intelligence”的功能套件的一部分。苹果与百度以及阿里巴巴的合作显示了该公司通过与多家AI合作伙伴签订非独占协议来降低风险。","news_type":1},"isVote":1,"tweetType":1,"viewCount":475,"authorTweetTopStatus":1,"verified":2,"comments":[{"author":{"id":"3498680662745699","authorId":"3498680662745699","name":"Mediator","avatar":"https://static.tigerbbs.com/ccbee84d06c97c8ea354bff2e5c20b6d","crmLevel":1,"crmLevelSwitch":1,"idStr":"3498680662745699","authorIdStr":"3498680662745699"},"content":"都是“传闻”,耍猴呢😂","text":"都是“传闻”,耍猴呢😂","html":"都是“传闻”,耍猴呢😂"}],"imageCount":0,"langContent":"CN","totalScore":0},{"id":396758907928768,"gmtCreate":1737887648613,"gmtModify":1737887650996,"author":{"id":"4148800825238972","authorId":"4148800825238972","name":"零度可口不可乐","avatar":"https://static.tigerbbs.com/7e2ca30d6c5566f087ae79b4937f0846","crmLevel":4,"crmLevelSwitch":1,"followedFlag":false,"idStr":"4148800825238972","authorIdStr":"4148800825238972"},"themes":[],"htmlText":"评论区太经典了","listText":"评论区太经典了","text":"评论区太经典了","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":5,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/396758907928768","repostId":"1161961252","repostType":2,"repost":{"id":"1161961252","kind":"news","pubTimestamp":1737873715,"share":"https://www.laohunote.com/m/news/1161961252?lang=&edition=full","pubTime":"2025-01-26 14:41","market":"us","language":"zh","title":"全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻","url":"https://stock-news.laohu8.com/highlight/detail?id=1161961252","media":"新智元","summary":"就在这当口,全球复现DeepSeek的一波狂潮也来了。更令人兴奋的是,成本不到30美金,就可以亲眼见证「啊哈」时刻。7B模型复刻,结果令人惊讶港科大助理教授何俊贤的团队,只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练。与DeepSeek R1类似,研究者的强化学习方案极其简单,没有使用奖励模型或MCTS类技术。随后,生成长度开始再次增加,此时出现了自我反思机制。","content":"<html><head></head><body><p>这些天,硅谷彻底处于中国公司带来的大地震余波中。</p><p>全美都在恐慌:是否全球人工智能的中心已经转移到了中国?</p><p>就在这当口,全球复现DeepSeek的一波狂潮也来了。</p><p>诚如LeCun所言:「这一次,正是开源对闭源的胜利!」</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/96443f59328eead1fb03ccf0f6e8b4a7\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"519\"/></p><blockquote><p>在没有顶级芯片的情况下,以极低成本芯片训出突破性模型的DeepSeek,或将威胁到美国的AI霸权。</p><p>大模型比拼的不再是动辄千万亿美元的算力战。</p><p>OpenAI、Meta、谷歌这些大公司引以为傲的技术优势和高估值将会瓦解,英伟达的股价将开始动摇。</p></blockquote><p>种种这些观点和讨论,让人不禁怀疑:数百亿美元支出,对这个行业真的必要吗?甚至有人说,中国量化基金的一群天才,将导致纳斯达克崩盘。</p><p>从此,大模型时代很可能会进入一个分水岭:超强性能的模型不再独属于算力巨头,而是属于每个人。</p><h2 id=\"id_1782456954\">30美金,就能看到「啊哈」时刻</h2><p>来自UC伯克利博士生潘家怡和另两位研究人员,在CountDown游戏中复现了DeepSeek R1-Zero。</p><p>他们表示,结果相当出色!</p><p>实验中,团队验证了通过强化学习RL,3B的基础语言模型也能够自我验证和搜索。</p><p>更令人兴奋的是,成本不到30美金(约217元),就可以亲眼见证「啊哈」时刻。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/9e5c66f649972cc1dcc1b64ac9e2312a\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"468\"/></p><p>这个项目叫做TinyZero,采用了R1-Zero算法——给定一个基础语言模型、提示和真实奖励信号,运行强化学习。</p><p>然后,团队将其应用在CountDown游戏中(这是一个玩家使用基础算术运算,将数字组合以达到目标数字的游戏)。</p><p>模型从最初的简单输出开始,逐步进化出自我纠正和搜索的策略。</p><p>在以下示例中,模型提出了解决方案,自我验证,并反复纠正,直到解决问题为止。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/7fdc1973cccfff685657e93776b421a6\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"645\"/></p><p>在消融实验中,研究人员运行了Qwen-2.5-Base(0.5B、1.5B、3B、7B四种参数规模)。</p><p>结果发现,0.5B模型仅仅是猜测一个解决方案然后停止。而从1.5B开始,模型学会了搜索、自我验证和修正其解决方案,从而能够获得更高的分数。</p><p>他们认为,在这个过程,基础模型的是性能的关键。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b5bf9a119224a98c43e0746453632356\" alt=\"\" title=\"\" tg-width=\"1024\" tg-height=\"872\"/></p><p>他们还验证了,额外的指令微调(SFT)并非是必要的,这也印证了R1-Zero的设计决策。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/9f1a78e6cf55328c051693886f074ca0\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"352\"/></p><p>这是首个验证LLM推理能力的实现可以纯粹通过RL,无需监督微调的开源研究</p><p>基础模型和指令模型两者区别:</p><ul style=\"list-style-type: disc;\"><li><p>指令模型运行速度快,但最终表现与基础模型相当</p></li><li><p>指令输出的模型更具结构性和可读性</p></li></ul><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/f32389410d6e5ede00b75380edf87e07\" alt=\"\" title=\"\" tg-width=\"1024\" tg-height=\"891\"/></p><p>此外,他们还发现,具体的RL算法并不重要。PPO、GRPO、PRIME这些算法中,长思维链(Long CoT)都能够涌现,且带来不错的性能表现。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/617d02e3d20394695f5f569d5f74c0d8\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"1128\"/></p><p>而且,模型在推理行为中非常依赖于具体的任务:</p><ul style=\"list-style-type: disc;\"><li><p>对于Countdow任务,模型学习进行搜索和自我验证</p></li><li><p>对于数字乘法任务,模型反而学习使用分布规则分解问题,并逐步解决</p></li></ul><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/96b4239d735ae442de73323b5bd4c965\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"643\"/></p><p>苹果机器学习科学家Yizhe Zhang对此表示,太酷了,小到1.5B的模型,也能通过RL涌现出自我验证的能力。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/3f01a77c2fff63fd05ba3d19af0bfeab\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"212\"/></p><h2 id=\"id_3291092331\">7B模型复刻,结果令人惊讶</h2><p>港科大助理教授何俊贤的团队(共同一作黄裕振、Weihao Zeng),只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练。</p><p>结果令人惊喜——模型在复杂的数学推理上取得了十分强劲结果。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/51085fb73be2a72ee23054c18e6df557\" alt=\"\" title=\"\" tg-width=\"870\" tg-height=\"185\"/></p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/17a612e8c7859f8429ee06ebe37234bb\" alt=\"项目地址:https://github.com/hkust-nlp/simpleRL-reason\" title=\"项目地址:https://github.com/hkust-nlp/simpleRL-reason\" tg-width=\"1080\" tg-height=\"492\"/><span>项目地址:https://github.com/hkust-nlp/simpleRL-reason</span></p><p>他们以Qwen2.5-Math-7B(基础模型)为起点,直接对其进行强化学习。</p><p>整个过程中,没有进行监督微调(SFT),也没有使用奖励模型。</p><p>最终,模型在AIME基准上实现了33.3%的准确率,在AMC上为62.5%,在MATH上为77.2%。</p><p>这一表现不仅超越了Qwen2.5-Math-7B-Instruct,并且还可以和使用超过50倍数据量和更复杂组件的PRIME和rStar-MATH相媲美!</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/fc28abafaf1b99ce393cf71fc2cfb483\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"613\"/></p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/00ddd59c6d8b6ab3b8d2cf89524b23c4\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"553\"/></p><p>其中,Qwen2.5-7B-SimpleRL-Zero是在Qwen2.5-Math-7B基础模型上仅使用纯PPO方法训练的,仅采用了MATH数据集中的8K样本。</p><p>Qwen2.5-7B-SimpleRL则首先通过Long CoT监督微调(SFT)作为冷启动,然后再进行强化学习。</p><p>在这两种方法中,团队都只使用了相同的8K MATH样本,仅此而已。</p><p>大概在第44步的时候,「啊哈时刻」出现了!模型的响应中,出现了自我反思。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/f3aa0b8e2d94bdc891f49c30a47aa475\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"438\"/></p><p>并且,在这个过程中,模型还显现了更长的CoT推理能力和自我反思能力。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/3320ec58f4e229808d3520653e70da3d\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>在博客中,研究者详细剖析了实验设置,以及在这个强化学习训练过程中所观察到的现象,例如长链式思考(CoT)和自我反思机制的自发形成。</p><p>与DeepSeek R1类似,研究者的强化学习方案极其简单,没有使用奖励模型或MCTS(蒙特卡洛树搜索)类技术。</p><p>他们使用的是PPO算法,并采用基于规则的奖励函数,根据生成输出的格式和正确性分配奖励:</p><ul style=\"list-style-type: disc;\"><li><p>如果输出以指定格式提供最终答案且正确,获得+1的奖励</p></li><li><p>如果输出提供最终答案但不正确,奖励设为-0.5</p></li><li><p>如果输出未能提供最终答案,奖励设为-1</p></li></ul><p>该实现基于OpenRLHF。初步试验表明,这个奖励函数有助于策略模型快速收敛,产生符合期望格式的输出。</p><h3 id=\"id_1461976375\" style=\"text-align: center;\">第一部分:SimpleRL-Zero(从头开始的强化学习)</h3><p>接下来,研究者为我们分享了训练过程动态分析和一些有趣的涌现模式。</p><h4 id=\"id_606216327\">训练过程动态分析</h4><p>如下所示,所有基准测试的准确率在训练过程中都在稳步提高,而输出长度则呈现先减少后逐渐增加的趋势。</p><p>经过进一步调查,研究者发现,Qwen2.5-Math-7B基础模型在初始阶段倾向于生成大量代码,这可能源于模型原始训练数据的分布特征。</p><p>输出长度的首次下降,是因为强化学习训练逐渐消除了这种代码生成模式,转而学会使用自然语言进行推理。</p><p>随后,生成长度开始再次增加,此时出现了自我反思机制。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/c617c450f7e378da91201c2612d6b7dc\" alt=\"训练奖励和输出长度\" title=\"训练奖励和输出长度\" tg-width=\"1076\" tg-height=\"432\"/><span>训练奖励和输出长度</span></p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/59ef982da18a27da8c6263d647691fa7\" alt=\"基准测试准确率(pass@1)和输出长度\" title=\"基准测试准确率(pass@1)和输出长度\" tg-width=\"1080\" tg-height=\"924\"/><span>基准测试准确率(pass@1)和输出长度</span></p><h4 id=\"id_224279804\">自我反思机制的涌现</h4><p>在训练到第 40 步左右时,研究者观察到:模型开始形成自我反思模式,这正是DeepSeek-R1论文中所描述的「aha moment」(顿悟时刻)。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/60580dff773b0a70b356c7267119e819\" alt=\"\" title=\"\" tg-width=\"1054\" tg-height=\"423\"/></p><h3 id=\"id_2889548553\" style=\"text-align: center;\">第二部分:SimpleRL(基于模仿预热的强化学习)</h3><p>如前所述,研究者在进行强化学习之前,先进行了long CoT SFT预热,使用了8,000个从QwQ-32B-Preview中提取的MATH示例响应作为SFT数据集。</p><p>这种冷启动的潜在优势在于:模型在开始强化学习时已具备long CoT思维模式和自我反思能力,从而可能在强化学习阶段实现更快更好的学习效果。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/c761a6c0f0b865f5c1645cc06ad9869e\" alt=\"\" title=\"\" tg-width=\"1053\" tg-height=\"445\"/></p><p>与RL训练前的模型(Qwen2.5-Math-7B-Base + 8K QwQ知识蒸馏版本)相比,Qwen2.5-7B-SimpleRL的平均性能显著提升了6.9个百分点。</p><p>此外,Qwen2.5-7B-SimpleRL不仅持续优于Eurus-2-7B-PRIME,还在5个基准测试中的3个上超越了Qwen2.5-7B-SimpleRL-Zero。</p><h3 id=\"id_1405061093\">训练过程分析</h3><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/7ca73d0446fd6af825ac840bba4c7b14\" alt=\"训练奖励和输出长度\" title=\"训练奖励和输出长度\" tg-width=\"1060\" tg-height=\"467\"/><span>训练奖励和输出长度</span></p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/07444422d9115a8382ed0f8843badb5f\" alt=\"基准测试准确率(pass@1)和输出长度\" title=\"基准测试准确率(pass@1)和输出长度\" tg-width=\"1080\" tg-height=\"638\"/><span>基准测试准确率(pass@1)和输出长度</span></p><p>Qwen2.5-SimpleRL的训练动态表现与Qwen2.5-SimpleRL-Zero相似。</p><p>有趣的是,尽管研究者先进行了long CoT SFT,但在强化学习初期仍然观察到输出长度减少的现象。</p><p>他们推测,这可能是因为从QwQ提取的推理模式不适合小型策略模型,或超出了其能力范围。</p><p>因此,模型选择放弃这种模式,转而自主发展新的长链式推理方式。</p><p>最后,研究者用达芬奇的一句话,对这项研究做了总结——</p><p>简约,便是最终极的精致。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/0031e63d9296afb7d700bb6315dbce70\" alt=\"图片\" title=\"图片\" tg-width=\"437\" tg-height=\"72\"/><span>图片</span></p><h2 id=\"id_2367102810\">完全开源复刻,HuggingFace下场了</h2><p>甚至,就连全球最大开源平台HuggingFace团队,今天官宣复刻DeepSeek R1所有pipeline。</p><p>复刻完成后,所有的训练数据、训练脚本等等,将全部开源。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/8b6a0735cb87c3f66a56724b33c3f08c\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"436\"/></p><p>这个项目叫做Open R1,当前还在进行中。发布到一天,星标冲破1.9k,斩获142个fork。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/883546a6427f0ae894da543e70c593aa\" alt=\"项目地址:https://github.com/huggingface/open-r1\" title=\"项目地址:https://github.com/huggingface/open-r1\" tg-width=\"1080\" tg-height=\"391\"/><span>项目地址:https://github.com/huggingface/open-r1</span></p><p>研究团队以DeepSeek-R1技术报告为指导,将整个复刻过程划分为三个关键步骤。</p><ul style=\"list-style-type: disc;\"><li><p><strong>步骤 1:</strong>通过从DeepSeek-R1蒸馏高质量语料库,复现R1-Distill模型。</p></li><li><p><strong>步骤 2:</strong>复现DeepSeek用于创建R1-Zero的纯强化学习(RL)流程。这可能需要为数学、推理和代码任务策划新的大规模数据集。</p></li><li><p><strong>步骤 3:</strong>展示我们如何通过多阶段训练,从基础模型发展到经过RL调优的模型。</p></li></ul><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/0b5e37647b6df05c2e00fdcae31c20a1\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"1238\"/></p><h2 id=\"id_1672370884\">从斯坦福到MIT,R1成为首选</h2><p>一个副业项目,让全世界科技大厂为之惶恐。</p><p>DeepSeek这波成功,也成为业界的神话,网友最新截图显示,这款应用已经在APP Store「效率」应用榜单中挤进前三。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/c26a66723d3b3a6b69f68a1478db0112\" alt=\"\" title=\"\" tg-width=\"966\" tg-height=\"1200\"/></p><p>在Hugging Face中,R1下载量直接登顶,另外3个模型也霸占着热榜。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/a17a15963d44d09684758a53d9f16d6e\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"1080\"/></p><p>a16z合伙人Anjney Midha称,一夜之间,从斯坦福到MIT,DeepSeek R1已经成为美国顶尖高校研究人员「首选模型」。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/95d7a12d8352525e938ddde62a68ba77\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"237\"/></p><p>还有研究人员表示,DeepSeek基本上取代了我用ChatGPT的需求。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/aef5ecd49dffdc200d6f1bd7a0647528\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"169\"/></p><p>中国AI,这一次真的震撼了世界。</p></body></html>","source":"lsy1569730104218","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻\n</h2>\n\n<h4 class=\"meta\">\n\n\n2025-01-26 14:41 北京时间 <a href=https://mp.weixin.qq.com/s/o41vPh9eJCVjCRUE4u5npA><strong>新智元</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>这些天,硅谷彻底处于中国公司带来的大地震余波中。全美都在恐慌:是否全球人工智能的中心已经转移到了中国?就在这当口,全球复现DeepSeek的一波狂潮也来了。诚如LeCun所言:「这一次,正是开源对闭源的胜利!」在没有顶级芯片的情况下,以极低成本芯片训出突破性模型的DeepSeek,或将威胁到美国的AI霸权。大模型比拼的不再是动辄千万亿美元的算力战。OpenAI、Meta、谷歌这些大公司引以为傲的...</p>\n\n<a href=\"https://mp.weixin.qq.com/s/o41vPh9eJCVjCRUE4u5npA\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://community-static.tradeup.com/news/4abae3de7bed37b48c01721c28c51931","relate_stocks":{},"source_url":"https://mp.weixin.qq.com/s/o41vPh9eJCVjCRUE4u5npA","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1161961252","content_text":"这些天,硅谷彻底处于中国公司带来的大地震余波中。全美都在恐慌:是否全球人工智能的中心已经转移到了中国?就在这当口,全球复现DeepSeek的一波狂潮也来了。诚如LeCun所言:「这一次,正是开源对闭源的胜利!」在没有顶级芯片的情况下,以极低成本芯片训出突破性模型的DeepSeek,或将威胁到美国的AI霸权。大模型比拼的不再是动辄千万亿美元的算力战。OpenAI、Meta、谷歌这些大公司引以为傲的技术优势和高估值将会瓦解,英伟达的股价将开始动摇。种种这些观点和讨论,让人不禁怀疑:数百亿美元支出,对这个行业真的必要吗?甚至有人说,中国量化基金的一群天才,将导致纳斯达克崩盘。从此,大模型时代很可能会进入一个分水岭:超强性能的模型不再独属于算力巨头,而是属于每个人。30美金,就能看到「啊哈」时刻来自UC伯克利博士生潘家怡和另两位研究人员,在CountDown游戏中复现了DeepSeek R1-Zero。他们表示,结果相当出色!实验中,团队验证了通过强化学习RL,3B的基础语言模型也能够自我验证和搜索。更令人兴奋的是,成本不到30美金(约217元),就可以亲眼见证「啊哈」时刻。这个项目叫做TinyZero,采用了R1-Zero算法——给定一个基础语言模型、提示和真实奖励信号,运行强化学习。然后,团队将其应用在CountDown游戏中(这是一个玩家使用基础算术运算,将数字组合以达到目标数字的游戏)。模型从最初的简单输出开始,逐步进化出自我纠正和搜索的策略。在以下示例中,模型提出了解决方案,自我验证,并反复纠正,直到解决问题为止。在消融实验中,研究人员运行了Qwen-2.5-Base(0.5B、1.5B、3B、7B四种参数规模)。结果发现,0.5B模型仅仅是猜测一个解决方案然后停止。而从1.5B开始,模型学会了搜索、自我验证和修正其解决方案,从而能够获得更高的分数。他们认为,在这个过程,基础模型的是性能的关键。他们还验证了,额外的指令微调(SFT)并非是必要的,这也印证了R1-Zero的设计决策。这是首个验证LLM推理能力的实现可以纯粹通过RL,无需监督微调的开源研究基础模型和指令模型两者区别:指令模型运行速度快,但最终表现与基础模型相当指令输出的模型更具结构性和可读性此外,他们还发现,具体的RL算法并不重要。PPO、GRPO、PRIME这些算法中,长思维链(Long CoT)都能够涌现,且带来不错的性能表现。而且,模型在推理行为中非常依赖于具体的任务:对于Countdow任务,模型学习进行搜索和自我验证对于数字乘法任务,模型反而学习使用分布规则分解问题,并逐步解决苹果机器学习科学家Yizhe Zhang对此表示,太酷了,小到1.5B的模型,也能通过RL涌现出自我验证的能力。7B模型复刻,结果令人惊讶港科大助理教授何俊贤的团队(共同一作黄裕振、Weihao Zeng),只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练。结果令人惊喜——模型在复杂的数学推理上取得了十分强劲结果。项目地址:https://github.com/hkust-nlp/simpleRL-reason他们以Qwen2.5-Math-7B(基础模型)为起点,直接对其进行强化学习。整个过程中,没有进行监督微调(SFT),也没有使用奖励模型。最终,模型在AIME基准上实现了33.3%的准确率,在AMC上为62.5%,在MATH上为77.2%。这一表现不仅超越了Qwen2.5-Math-7B-Instruct,并且还可以和使用超过50倍数据量和更复杂组件的PRIME和rStar-MATH相媲美!其中,Qwen2.5-7B-SimpleRL-Zero是在Qwen2.5-Math-7B基础模型上仅使用纯PPO方法训练的,仅采用了MATH数据集中的8K样本。Qwen2.5-7B-SimpleRL则首先通过Long CoT监督微调(SFT)作为冷启动,然后再进行强化学习。在这两种方法中,团队都只使用了相同的8K MATH样本,仅此而已。大概在第44步的时候,「啊哈时刻」出现了!模型的响应中,出现了自我反思。并且,在这个过程中,模型还显现了更长的CoT推理能力和自我反思能力。在博客中,研究者详细剖析了实验设置,以及在这个强化学习训练过程中所观察到的现象,例如长链式思考(CoT)和自我反思机制的自发形成。与DeepSeek R1类似,研究者的强化学习方案极其简单,没有使用奖励模型或MCTS(蒙特卡洛树搜索)类技术。他们使用的是PPO算法,并采用基于规则的奖励函数,根据生成输出的格式和正确性分配奖励:如果输出以指定格式提供最终答案且正确,获得+1的奖励如果输出提供最终答案但不正确,奖励设为-0.5如果输出未能提供最终答案,奖励设为-1该实现基于OpenRLHF。初步试验表明,这个奖励函数有助于策略模型快速收敛,产生符合期望格式的输出。第一部分:SimpleRL-Zero(从头开始的强化学习)接下来,研究者为我们分享了训练过程动态分析和一些有趣的涌现模式。训练过程动态分析如下所示,所有基准测试的准确率在训练过程中都在稳步提高,而输出长度则呈现先减少后逐渐增加的趋势。经过进一步调查,研究者发现,Qwen2.5-Math-7B基础模型在初始阶段倾向于生成大量代码,这可能源于模型原始训练数据的分布特征。输出长度的首次下降,是因为强化学习训练逐渐消除了这种代码生成模式,转而学会使用自然语言进行推理。随后,生成长度开始再次增加,此时出现了自我反思机制。训练奖励和输出长度基准测试准确率(pass@1)和输出长度自我反思机制的涌现在训练到第 40 步左右时,研究者观察到:模型开始形成自我反思模式,这正是DeepSeek-R1论文中所描述的「aha moment」(顿悟时刻)。第二部分:SimpleRL(基于模仿预热的强化学习)如前所述,研究者在进行强化学习之前,先进行了long CoT SFT预热,使用了8,000个从QwQ-32B-Preview中提取的MATH示例响应作为SFT数据集。这种冷启动的潜在优势在于:模型在开始强化学习时已具备long CoT思维模式和自我反思能力,从而可能在强化学习阶段实现更快更好的学习效果。与RL训练前的模型(Qwen2.5-Math-7B-Base + 8K QwQ知识蒸馏版本)相比,Qwen2.5-7B-SimpleRL的平均性能显著提升了6.9个百分点。此外,Qwen2.5-7B-SimpleRL不仅持续优于Eurus-2-7B-PRIME,还在5个基准测试中的3个上超越了Qwen2.5-7B-SimpleRL-Zero。训练过程分析训练奖励和输出长度基准测试准确率(pass@1)和输出长度Qwen2.5-SimpleRL的训练动态表现与Qwen2.5-SimpleRL-Zero相似。有趣的是,尽管研究者先进行了long CoT SFT,但在强化学习初期仍然观察到输出长度减少的现象。他们推测,这可能是因为从QwQ提取的推理模式不适合小型策略模型,或超出了其能力范围。因此,模型选择放弃这种模式,转而自主发展新的长链式推理方式。最后,研究者用达芬奇的一句话,对这项研究做了总结——简约,便是最终极的精致。图片完全开源复刻,HuggingFace下场了甚至,就连全球最大开源平台HuggingFace团队,今天官宣复刻DeepSeek R1所有pipeline。复刻完成后,所有的训练数据、训练脚本等等,将全部开源。这个项目叫做Open R1,当前还在进行中。发布到一天,星标冲破1.9k,斩获142个fork。项目地址:https://github.com/huggingface/open-r1研究团队以DeepSeek-R1技术报告为指导,将整个复刻过程划分为三个关键步骤。步骤 1:通过从DeepSeek-R1蒸馏高质量语料库,复现R1-Distill模型。步骤 2:复现DeepSeek用于创建R1-Zero的纯强化学习(RL)流程。这可能需要为数学、推理和代码任务策划新的大规模数据集。步骤 3:展示我们如何通过多阶段训练,从基础模型发展到经过RL调优的模型。从斯坦福到MIT,R1成为首选一个副业项目,让全世界科技大厂为之惶恐。DeepSeek这波成功,也成为业界的神话,网友最新截图显示,这款应用已经在APP Store「效率」应用榜单中挤进前三。在Hugging Face中,R1下载量直接登顶,另外3个模型也霸占着热榜。a16z合伙人Anjney Midha称,一夜之间,从斯坦福到MIT,DeepSeek R1已经成为美国顶尖高校研究人员「首选模型」。还有研究人员表示,DeepSeek基本上取代了我用ChatGPT的需求。中国AI,这一次真的震撼了世界。","news_type":1},"isVote":1,"tweetType":1,"viewCount":471,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0},{"id":272193514520808,"gmtCreate":1707491261776,"gmtModify":1707492290814,"author":{"id":"4148800825238972","authorId":"4148800825238972","name":"零度可口不可乐","avatar":"https://static.tigerbbs.com/7e2ca30d6c5566f087ae79b4937f0846","crmLevel":4,"crmLevelSwitch":1,"followedFlag":false,"idStr":"4148800825238972","authorIdStr":"4148800825238972"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/U/3574165633159802\"> @David159 </a>好运常伴","listText":"<a href=\"https://laohu8.com/U/3574165633159802\"> @David159 </a>好运常伴","text":"@David159 好运常伴","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/272193514520808","isVote":1,"tweetType":1,"viewCount":762,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0}],"defaultTab":"following","isTTM":false}