重磅!华南理工大学团队提出自然语言微调技术(NLFT),助力大模型普及!
更新时间:2025-02-13

AEIC官网-版头.gif


随着国家推动人工智能创新与应用、实现自主可控技术突破和产业转型升级的趋势、要求和数字经济的迅猛发展,人工智能大语言模型(LLM)被视为新一代信息工业革命的基础设施和新型生产力,能够为各行业的智能化进程注入强大动力。


近日,由华南理工大学计算机科学与工程学院长聘正教授、华中科技大学嵌入式与普适计算原实验室主任陈敏教授主导,联合了华中科技大学、琶洲实验室与华南理工大学的科研团队,在自然语言大模型小样本微调研究领域取得重要突破。论文“Natural Language Fine-Tuning”提出了一种简单、低成本且极大提高准确率的全新方案——自然语言微调(NLFT)。


640 (1).png

论文链接:https://arxiv.org/abs/2412.20382


科研团队利用AI领域攻关取得的成果,提出了自然语言微调技术(NLFT)。这一技术通过利用少量随机训练数据,经过少数几轮训练,在较短时间和有限显存条件下,能够显著提升基础大语言模型(LLM)的准确率。与字节跳动提出的强化微调(ReFT)相比,NLFT在时间和空间复杂度上都有明显优化,并且仍具有较大的提升潜力。该技术为突破传统微调方法中对大量数据和高算力资源的依赖提供了新的可能。NLFT是科研团队自主研发的国内具有独特优势的算法。


从宏观层面看,NLFT可以视为对传统监督微调(SFT)技术的一种优化。与强化微调(ReFT)不同,NLFT通过对token级别的细粒度优化,能够有效替代传统的SFT过程,无需像ReFT那样进行多轮预热,从而省去了大模型的预热环节(warm-up),支持冷启动(cold-start)。具体而言,科研团队利用目标模型本身作为自然语言评价器,发挥其对语言的深刻理解能力,精准标注出答题过程中的得分点与失分点。这一过程不依赖任何外部指导,充分展示了NLFT在领域微调中的高效性与可操作性。


自然语言微调(NLFT)方案以简洁的设计、较低的成本投入,以及准确率提升中的显著成效,大幅降低了大语言模型(LLM)的准入门槛,摆脱了以往对海量数据和高算力资源的依赖,使得LLM更加平民化,使用该技术在单张消费级显卡RTX 4090上跑通的8b微调大模型,可以在使用极少专家数据的前提下获得成倍的性能提升,为LLMs的大规模训练和部署提供了新的可能性。提升了其在特定细分领域的能力,减少了传统微调方法需要借助大量领域数据所带来的高昂成本。


640.png


自然语言微调技术的核心理念


研究团队正在积极开展领域微调的泛化研究,探索其在多个应用领域的潜力。例如,在医学诊断中,团队利用少量有标签数据,并结合思维链与比对生成的内容与标签,实现了词元精准标注和推理优化。除此之外,NLFT技术在程序设计、自然语言推理复杂问答系统等领域也具有广泛应用前景,预计将为细粒度模型微调提供重要支持,推动更多实际应用的落地。


AEIC官网-版尾.bmp

相关阅读
刚刚!教育部公布第二轮“双一流”名单!(附两轮名单下载)
2022-02-14
2022中国高被引学者榜单出炉!
2023-03-28
第一档! 首轮“双一流”成效评价已公布!四川大学率先发布建设成效
2022-02-23
你清高,风头都是你出!期刊三兄弟,大哥吃尽红利,发展为领域TOP1,二弟三弟销声匿迹……
2022-03-25
重磅!中国科学院院士,任深圳大学新任校长!
2022-02-23
宇宙的尽头不是考公了???国外知名大学硕士舍弃公务员岗位,跑来中国读博......
2022-03-25
453人伤亡,俄罗斯和乌克兰,何以至此?
2022-03-25
论文观察 | 即将被Science撤稿,“明星”论文数据造假,百万科研经费打水漂
2022-02-23
活久见,学者与纪委开撕!中国学者因学术纪委同步其撤稿信息,下场撕逼怒喷“国粹”!
2022-03-30
经费预算30亿,毕业生组队住“鬼城”,这所有钱又低调的“土豪”大学,早就不该是双非了…
2022-05-17
比肩浙大,全国首批211高校,校名却被空置12年。这所高校终于要重建了?
2022-04-15
刚刚!2023中科院期刊预警名单来了!(附2021/2020预警名单)
2023-01-31
院系大调整!这所百年名校,又有重大变化
2022-09-21
期刊界的“黑手党”:曾影射克林顿丑闻,发表奥巴马文章,如今它被捧上神坛!
2022-02-23
果然六朝古都,野猪都上985,高校:那是我们的知名校友……
2022-04-15
中国最硬气的大学,粉红色
2022-09-26
这!也!行?Nature大子刊被曝无理由拒稿,随意更改作者名单,号称领域第一却专做荒唐事......
2022-03-15
突破!浙江工业大学首次以第一单位发Science
2022-02-23
极大关注!Nature子刊论文一作与读者唇枪舌战16个回合,通讯作者不胜其烦下场开撕……
2022-03-25
突然爆红!这所双一流因一名年轻导师获赞无数,学生:谁说我校名不副实?
2022-04-11