活动报名|24点超98%准确率,“步步为营”模拟人类思维

747次阅读
没有评论

活动报名|24点超98%准确率,“步步为营”模拟人类思维



主持人 袁洋


袁洋,清华大学交叉信息学院助理教授。2012年毕业于北京大学计算机系,2018年获得美国康奈尔大学计算机博士学位,师从Robert Kleinberg教授。他于2018-2019年前往麻省理工学院大数据科学学院(MIFODS)做博士后,袁洋的主要研究方向是智能医疗、AI基础理论、应用范畴论。



分享嘉宾 张伊凡 


张伊凡,清华大学交叉信息学院博士研究生。2021年本科毕业于于北京大学元培学院,现师从袁洋助理教授,主要研究方向为基础模型(大语言模型)的理论和算法,自监督学习和可信人工智能




分享嘉宾 杨景钦


杨景钦,清华大学交叉信息研究院(IIIS)博士生。2021年毕业于清华大学交叉信息研究院获得学士学位,目前师从袁洋助理教授攻读博士学位。主要研究方向包括大语言模型,自监督学习以及智能医疗。


思维链如何解锁并释放大模型的隐藏能力


智源LIVE将于2023年09月06日14:30-15:30线上召开,本期活动邀请了清华大学交叉信息研究院博士生张伊凡和杨景钦进行线上报告,题目为《累积推理(Cumulative Reasoning)框架与大语言模型推理》。  
累积推理(Cumulative Reasoning,简称CR)作为一种新的方法,拥有强大的问题解决能力,特别是在高度复杂的任务场景下。在本次报告中,研究团队将讲述CR的设计思想,分析已有的方法的优势和缺陷,并介绍一些实验结论。

除此以外,还将讨论未来延续该工作的计划,以及在更多场景下的可能性。报告将展示CR在逻辑推理任务和24点游戏上实现了98%的准确率,以及在MATH数据集上建立了新的SOTA成绩。  
As a new method, Cumulative Reasoning (CR) has strong problem-solving capabilities, especially in highly complex task scenarios. In this talk, the research team will discuss the design principles of CR, analyze the advantages and limitations of existing methods, and introduce some experimental conclusions. In addition, they will also discuss future plans for extending this work and its potential in other domains. The talk will showcase the significant achievements of CR in logical reasoning tasks and the Game of 24 with 98% accuracy, and establish new state-of-the-art results on the MATH dataset.

活动时间:9月6日(周三)14:30-15:30


活动形式:线上直播,点击“阅读原文”进行预约


活动报名|24点超98%准确率,“步步为营”模拟人类思维




 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy