【环球聚看点】双创青年逐梦上海 | 达观数据陈运文：攻克关键核心技术，咬着牙也得上

2023-05-19 07:12:32 来源：文汇网

口述者：陈运文（达观数据董事长）

整理：本报记者占悦

(资料图片)

当ChatGPT风靡全球时，对于我们专注于文档智能化处理与大数据挖掘的一家科技公司而言，一场漫长而艰苦的“拉锯战”开始了：我们要做自主研发版的大语言模型。

早在6年前OpenAI就发布了第一代GPT技术，那时除了学术圈，社会大众少有关注。直至去年11月底ChatGPT正式发布，才像一块石头砸入水中，激起浪花无数。短短数年时间，技术迭代以光速般跨越，撬动整个社会与行业的变革。

尽管我们作出了自主研发的决定，首先要做足的是心理建设——从哪里入手才能尽快追赶同行脚步？开弓没有回头箭，咬着牙也得上。

这一路都是“黑夜独行”。海外同行没有公布GPT训练过程的工程细节和参数方法这类核心要素，大模型优异的效果隐藏在诸多技术细节里，为了给团队更多知识补给，我们向复旦大学计算机科学技术学院的教授们请教，翻阅了许多业界顶尖论文和技术报告。每周技术团队都在反复讨论技术方案，开展各种交流研讨，逐字逐句探究“核心指南”。

同时，硬件试验设备也得跟上。由于大语言模型需要消耗大量的算力与海量的数据，我们采购了一批高性能的科学运算GPU（图形处理器）。这确实是相当大的技术投入，但为了加速国产模型的研发还是非常值得的。

除了作为人工智能基础设施的算力平台，大模型的训练还需要巨大规模的训练数据。数据好比智能时代的“石油”。我们投入了非常大精力来积累和提炼文本数据，源源不断地投入模型的训练——这些数据规模比一所大学图书馆所有藏书量都要大得多。

我们的研发团队每天都在绞尽脑汁攻克技术难关。训练过程中，有监督的精调技术十分关键，提示词的设计也有技巧。我们尝试了上百次各种有监督精调技术的试验，与各类数据蒸馏加工的技巧，逐步摸索出了一个有效的大语言模型蒸馏和精调方法。测试效果很好，我们越来越有信心。截至目前，公司申请有国家发明专利200余项，授权国家发明专利42项，拥有8项国际发明专利（PCT），授权软著200余项。

年初至今，我们一直在思考垂直场景下大模型的落地产品。不同于ChatGPT的通用模型，我们选择面向垂直行业的企业客户来开发文档资料处理系统，实现模型的本地化部署，让模型具备更高的可靠性、安全性与准确性，由此更符合市场需求。

就连产品取名也费了些脑筋，大家在90多个候选名字中最终挑选了“曹植”这个独特的名字，因为曹植有“七步成诗”的美名，希望我们的系统也能流畅地创作写作，源源不断生成内容。

我们的目标是：今年6月底发布正式版本。现在团队每天都很紧张，日拱一卒，还有无数技术“鸿沟”等着我们翻越——只有对质量细节“吹毛求疵”才能让产品更精致。

创新创业生涯中这次的挑战很苦很累，但我相信这会带来中国文档智能处理方面的重要突破。我们公司的每一个会议室都是以计算机算法来命名的，等到“曹植”这一产品亮相后，将会用新的核心算法名称挂在会议室门口，以记住这段与时间赛跑的日子。

>>>记者手记：最艰难的挑战永远是下一个

务实求真、通达乐观，这是达观数据的企业信条，也是陈运文创业以来的经验总结。

企业健康发展，就得扎扎实实写好每一行代码、交付好每一个项目，创业长路漫漫，对未来时刻保有信心，才能守得云开见月明。

创业刚起步时，他也曾碰过不少钉子，主动向各行业请教经验，学习新趋势、研究新方法；面对“无人区”，他将其视作机遇，一头扎进文档智能处理研发；如今，飞速迭代的人工智能更燃起他的“征服欲”，要跑得比技术更快一些。

最难的挑战永远都在下一个。如果说创业初期是基于自信，如今陈运文凭借的是实打实的乐观与扎实的技术，更不惧怕失败。创新创业的他，有着青年人最闪耀的样子：立桅扬帆，乘风破浪。

作者：占悦

编辑：范菁

*文汇独家稿件，转载请注明出处。

标签：

上一篇 : 【天天快播报】中广核电力（01816.HK）：5月18日南向资金减持221.9万股

下一篇 : 最后一页

推荐阅读

【环球聚看点】双创青年逐梦上海 | 达观数据陈运文：攻克关键核心技术，咬着牙也得上

口述者：陈运文（达观数据董事长）整理：本报记者占悦当ChatGPT风靡全球时，对于我们专注于文档智能化处理

05-19 07:12:32

【天天快播报】中广核电力（01816.HK）：5月18日南向资金减持221.9万股

5月18日北向资金减持221 9万股中广核电力（01816 HK）。近5个交易日中，获南向资金增持的有3天，累计净增持

05-19 06:05:47

世界新消息丨教师自我介绍范文300字怎么写_教师自我介绍范文300字

1、成长中的我充满欢乐，充满微笑，充满自信，充满成功，但也充满忧虑，充满无奈，充满痛苦、充满急躁。2、

05-19 04:50:57

保卫萝卜挑战30攻略通关图文详解_保卫萝卜挑战30 环球今日报

1、保卫萝卜挑战30关的金萝卜是有些难以拿到的，30关的重点在于前面3波顺利打出奖励炮塔以及最后一波要更换

05-19 02:42:44

“有福之州博物馆之夜”活动上演奇妙之夜

现场带来极具特色的表演。林双伟摄东南网5月18日讯（本网记者陈楠周霞陈静）今晚，“有福之州博物馆之夜

05-19 00:15:59

陈亦博：美盘空单大获全胜，跟上操作即赚钱

陈亦博：美盘空单大获全胜，跟上操作即赚钱黄金跌落1955附近直接多，止损1947，目标1970上方

05-18 22:14:22

川观解读丨新一轮找矿突破战略行动大幕拉开，四川有何谋划？

矿产资源被称作工业粮食，为经济社会发展提供有力保障。近日，经过一年多的调查论证和周密筹备，四川全面启

05-18 21:44:20

雅思组合艰难拔得头筹，石宇奇避而不出，陈雨菲建功锁定胜利

羽毛球苏迪曼杯小组赛最后一轮，中国队遭遇强劲对手-丹麦队，雅思组合率先亮相艰难拔得头筹，锁定了第一分

05-18 20:55:18

世界热门:怎么给电脑设置开机密码锁屏_怎么给电脑设置开机密码

1、首先，我们点击桌面左下角的“开始”菜单，找到并点击“控制面板”选项，如图；2、2 在控制面板列表...

05-18 19:58:27

广西2023会计初级成绩查询时间及资格后审安排-焦点热门

广西2023年初级会计职称成绩查询时间安排：1 2023年6月16日前，“全国会计资格评价网”公布2023年度初级资

05-18 19:11:09

福田区新洲小学改建全面完工全市首个近零碳校园投入使用|全球看点

福田区新洲小学改建全面完工近日，深圳全市首批近零碳校园试点——福田区新洲小学改建工程率先全面完工...

05-18 18:44:09

当前快报:果蔬罐头行业市场规模有多大？果蔬罐头行业市场份额

水果罐头以用料不同而命名不同，一般水果罐头的原料取材于水果，包括黄桃，苹果，荔枝，草莓，山楂等。产品

05-18 18:07:09

2022年国内智能手机出货量达2.64亿部其中2.6亿部手机支持北斗功能

5月18日，中国卫星导航定位协会在京发布《2023中国卫星导航与位置服务产业发展白皮书》，显示2022年国内智

05-18 17:49:38

全球百事通！云南普洱思茅:“小茶花”未检团队是这样炼成的

近年来，云南省普洱市思茅区检察院“小茶花”未检团队立足未成年人检察职责，按照“捕、诉、监、防、教...

05-18 17:22:09

国家医保局：全面落实参保女职工生育三孩的生育保险待遇

国家医保局：全面落实参保女职工生育三孩的生育保险待遇,主流媒体,山西门户。山西新闻网是经国务院新闻办审

05-18 16:41:18

腾讯游戏Q1国际市场贡献颇丰，未成年人游戏时长占比创新低

据中国音数协游戏工委、中国游戏产业研究院联合伽马数据共同发布的《2022中国游戏产业未成年人保护进展报告

05-18 16:16:12

LOL第一上单也有短板？小超梦偶遇狂热粉丝后害羞：对线细节下饭

虽然剑姬这名英雄对于小超梦而言还在练习，但作为第一上单的他还是操作剑姬打出了非常多波细腻的操作，不断

05-18 15:22:51

世界速讯：新能源汽车产业加快技术突破成为稳工业重要力量

5月17日举行的新闻发布会上，国家发展改革委新闻发言人孟玮表示，当前，中国新能源汽车产业正面临前所未有

05-18 15:06:35

2023年山西省科技活动周活动异彩纷呈

5月17日，记者从山西省科技厅获悉，为加强山西省科普能力建设，深入实施全民科学素质行动，5月20日至31日，

05-18 14:25:12

苹果公布iOS17无障碍新功能每日视点

苹果iOS17系统推出残障人士辅助功能，包括“辅助访问”、“实时语音”等，提供更多便利。

05-18 13:54:31

四季歌歌词中文_四季歌歌词

1、四季歌演唱：邓丽君田汉词贺绿汀曲春季到来绿满窗，大姑娘窗下绣鸳鸯。2、忽然一阵无情棒，打得鸳鸯各一

05-18 13:05:21

潮宏基：5月15日组织现场参观活动，国泰君安、华泰证券等多家机构参与_全球观焦点

2023年5月17日潮宏基（002345）发布公告称公司于2023年5月15日组织现场参观活动，国泰君安、华泰证券、万纳

05-18 12:26:15

美地质学家警告：纽约在建筑物重压下逐年下沉面临严重洪水威胁

美国纽约海外网5月18日电据美国《纽约邮报》网站5月17日报道，美国一份最新地质研究报告显示，纽约面临严重

05-18 11:44:11

每日精选：青白江区天和睿城人才公寓剩余房源销售对象

成都市青白江区天和睿城人才公寓（二批次）项目剩余房源销售对象本项目剩余房源针对以下对象按批次顺序进行

05-18 11:05:44

小英雄雨来主要情节_小英雄雨来主要内容200字-环球百事通

1、>主要写了在抗日战争时期，晋察冀边区十二岁的雨来是一个游泳本领很强的孩子，一次交通员李大叔为了...

05-18 10:44:27

红颜知己指的是什么关系_红颜知己的解释全球热头条

红颜知己指的是什么关系，红颜知己的解释很多人还不知道，现在让我们一起来看看吧！1、红颜知己是与男性关

05-18 10:30:19

走好“工业强县”之路万安如何发力？全球观察

5月14日，万安全县工口工作调度推进会召开。作为一个工业基础不强的县，万安提出的“工业强县”目标背后...

05-18 09:54:37

前脚哭惨，后脚翻车！离开董明珠的孟羽童，已走上一条“不归路” 焦点信息

前脚哭惨，后脚翻车！离开董明珠的孟羽童，已走上一条“不归路”,格力,离职,董明珠,孟羽童,不归路,小说家

05-18 09:19:43

重庆直飞桃园客运航线复航_焦点讯息

中新社重庆5月17日电(张旭)载有约70名乘客的CA409航班17日从重庆江北国际机场起飞，飞往台湾桃园机场，标志着时

05-18 08:55:53

壮大农村集体经济的崆峒探索

新甘肃·甘肃经济日报记者段睿珺通讯员梁璐夏日，走进平凉市崆峒区，或在十里铺村感受城郊村转型发...

05-18 08:07:56

2022佛山西樵山桃花开了吗？ 2021年西樵山茶花开了吗|全球讯息

2022佛山西樵山桃花开了。走进西樵山桃花园，一朵朵俏丽的桃花开在枝头，在明媚的春光下，格外灿烂。详情见

05-18 07:45:08

诛仙3一天赚多少人民币_诛仙3怎么赚钱-当前热讯

1、金币。2、寻宝网(或者一拍)金价除了新区一般都是1:2500-4000之间不买就做yb商人yb就是充钱不充钱就去抽奖

05-18 05:00:03

苟在忍者世界最新章节无弹窗笔趣阁_苟在忍者世界

1、不存在了，不知道你看过一个中国放的纪录片没有，就是DISCOVERY探索频道在日本拍的关于武士道和忍者的片

05-18 02:50:53

盐亭县气象台发布大风蓝色预警信号【IV级/一般】【2023-05-17】|全球速讯

盐亭县气象台2023年05月17日21时27分发布大风蓝色预警信号：预计未来24小时内我县有4～6级偏北风，山口河谷

05-18 00:10:18

建议提前2-3小时到！多地机场最新提醒_全球热议

澎湃新闻

05-17 22:18:48

天一联考成绩查询入口2022（天一联考成绩查询）_环球简讯

1、考试成绩一般是只能在学校的官网上面查询到的，其他地方查不到，在这里问更是不现实。2、最方便的做法还

05-17 21:22:14

彩云之南再行记之一百七十四昭通之二昭通博物馆（上）环球动态

2017年10月11日，早上8点从昭通火车站前坐车去昭通市内参观游览。火车站在市内的北部，到市内大约还有十来

05-17 20:07:02

全球今热点：取消设备合同范本(汇总5篇)

取消设备合同范本第1篇设备合同解除通知函__________：因________________________________________，公司

05-17 19:35:44

环球视讯！填大坑游戏_填大坑

1、大嘴棋牌算法计分规则·积分计算满足以下条件之一的玩家判获胜一局，其他玩家判负。2、（1）开牌后按...

05-17 18:59:42

环球观察：拆迁未盖好没有房产证怎么处理

一、拆迁未盖好没有房产证怎么处理房屋拆迁没有房产证处理方法如下：1 对于未取得房产证但能够证明该房屋是

05-17 18:09:36

环球热门:QQ召唤AI绘画机器人，Midjourney联手

数智世界风起云涌，互联网新旧迭代，元宇宙蓬勃而出。m360互联网日报，从更全面的视野、更广阔的视域，洞察

05-17 17:09:51

残杀中国商人，3名犯罪嫌疑人落网：2男1女，均为泰国人

5月16日，泰国警方通报，一名中国商人在泰国董里府一度假村被害身亡。被害人为中国籍橡胶木材出口商李志瑞

05-17 16:45:04

东莞市2023年中小学生科学教育系列科技竞赛活动名单出炉天天热门

根据《教育部办公厅关于公布2022-2025学年面向中小学生的全国性竞赛活动的通知》《广东省教育厅关于公布202

05-17 16:11:42

环球今日报丨工程机械企业深耕细作站稳国内市场脚跟加速开拓国际市场

工程机械企业深耕细作站稳国内市场脚跟加速开拓国际市场---湖南长沙是全国的工程机械制造基地之一，这里云

05-17 16:05:21

杭州孔凤春智颂化妆品有限公司_关于杭州孔凤春智颂化妆品有限公司概略

1、杭州孔凤春智颂化妆品有限公司于2018年09月17日成立。法定代表人吴名德，公司经营范围包括：销售：化妆

05-17 15:21:24

带你沉浸式感受世界眼中的大运成都热点聚焦

成都大运会即将举办，来自世界各地的年轻运动员们将以青春之名共赴大运之约。盛事临近，成都正以开放、包容

05-17 14:18:09

天天热推荐：谷城交警联合市场监管局开展遮阳伞（篷）源头整治行动

谷城交警联合市场监管局开展遮阳伞（篷）源头整治行动---为了巩固摩托车、电动车加装遮阳伞（篷）路面整治

05-17 13:41:35

水池万能支撑器价格_万能支撑器价格

1、首先像你说的现在市场上虽然挺多卖万能支撑器的商家，但是源头厂家并不算多，市场上就那么几家。2、因为

05-17 12:52:15

1419枚核弹头瞄准中俄，美亮核大棒逼问俄罗斯，中方也被“警告”

文君剑16日据《澎湃新闻》报道，美国近日一反常态，主动“坦白”了自己的核弹头部署数量。美国声称，...

05-17 12:17:25

PI5月活动预告-环球头条

欢迎参加由世纪电源网主办的中国新能源汽车电力电子技术产业大会以及电源网主办的第五届国际宽禁带直播节。

05-17 11:42:05

精彩推送

【天天快播报】中广核电力（01816.HK）：5月18日南向资金减持221.9万股

世界新消息丨教师自我介绍范文300字怎么写_教师自我介绍范文300字

保卫萝卜挑战30攻略通关图文详解_保卫萝卜挑战30 环球今日报

“有福之州博物馆之夜”活动上演奇妙之夜

陈亦博：美盘空单大获全胜，跟上操作即赚钱

川观解读丨新一轮找矿突破战略行动大幕拉开，四川有何谋划？

雅思组合艰难拔得头筹，石宇奇避而不出，陈雨菲建功锁定胜利

世界热门:怎么给电脑设置开机密码锁屏_怎么给电脑设置开机密码

广西2023会计初级成绩查询时间及资格后审安排-焦点热门

福田区新洲小学改建全面完工全市首个近零碳校园投入使用|全球看点

当前快报:果蔬罐头行业市场规模有多大？果蔬罐头行业市场份额

2022年国内智能手机出货量达2.64亿部其中2.6亿部手机支持北斗功能

全球百事通！云南普洱思茅:“小茶花”未检团队是这样炼成的

国家医保局：全面落实参保女职工生育三孩的生育保险待遇

腾讯游戏Q1国际市场贡献颇丰，未成年人游戏时长占比创新低

LOL第一上单也有短板？小超梦偶遇狂热粉丝后害羞：对线细节下饭

世界速讯：新能源汽车产业加快技术突破成为稳工业重要力量

2023年山西省科技活动周活动异彩纷呈

苹果公布iOS17无障碍新功能每日视点

四季歌歌词中文_四季歌歌词

潮宏基：5月15日组织现场参观活动，国泰君安、华泰证券等多家机构参与_全球观焦点

美地质学家警告：纽约在建筑物重压下逐年下沉面临严重洪水威胁

每日精选：青白江区天和睿城人才公寓剩余房源销售对象

小英雄雨来主要情节_小英雄雨来主要内容200字-环球百事通

红颜知己指的是什么关系_红颜知己的解释全球热头条

走好“工业强县”之路万安如何发力？全球观察

前脚哭惨，后脚翻车！离开董明珠的孟羽童，已走上一条“不归路” 焦点信息

重庆直飞桃园客运航线复航_焦点讯息

壮大农村集体经济的崆峒探索

2022佛山西樵山桃花开了吗？ 2021年西樵山茶花开了吗|全球讯息

诛仙3一天赚多少人民币_诛仙3怎么赚钱-当前热讯

苟在忍者世界最新章节无弹窗笔趣阁_苟在忍者世界

盐亭县气象台发布大风蓝色预警信号【IV级/一般】【2023-05-17】|全球速讯

建议提前2-3小时到！多地机场最新提醒_全球热议

天一联考成绩查询入口2022（天一联考成绩查询）_环球简讯

彩云之南再行记之一百七十四昭通之二昭通博物馆（上）环球动态

全球今热点：取消设备合同范本(汇总5篇)

环球视讯！填大坑游戏_填大坑

环球观察：拆迁未盖好没有房产证怎么处理

环球热门:QQ召唤AI绘画机器人，Midjourney联手

残杀中国商人，3名犯罪嫌疑人落网：2男1女，均为泰国人

东莞市2023年中小学生科学教育系列科技竞赛活动名单出炉天天热门

环球今日报丨工程机械企业深耕细作站稳国内市场脚跟加速开拓国际市场

杭州孔凤春智颂化妆品有限公司_关于杭州孔凤春智颂化妆品有限公司概略

带你沉浸式感受世界眼中的大运成都热点聚焦

天天热推荐：谷城交警联合市场监管局开展遮阳伞（篷）源头整治行动

水池万能支撑器价格_万能支撑器价格

1419枚核弹头瞄准中俄，美亮核大棒逼问俄罗斯，中方也被“警告”

PI5月活动预告-环球头条

美得州一快餐店发生枪杀案 2名嫌疑人被控谋杀罪

X 广告

行业动态

行业资讯

植物科普

植物收藏

园林景观

绿色生活

【环球聚看点】双创青年逐梦上海 | 达观数据陈运文：攻克关键核心技术，咬着牙也得上

福建尤溪县融媒体中心亮相2021中国网络媒体论坛展示会

中老铁路开通在即，建设者回味在“水豆腐”里打隧道的日子

5G、8K、AI……媒体未来什么样？记者探馆中国网络媒体论坛

深圳将实施重点行业领域降碳行动促进城市绿色低碳发展

上海新增新冠本土病例，专家提醒来了

哈尔滨今冬冰雪旅游季启幕

【环球聚看点】双创青年逐梦上海 | 达观数据陈运文：攻克关键核心技术，咬着牙也得上

福建尤溪县融媒体中心亮相2021中国网络媒体论坛展示会

中老铁路开通在即，建设者回味在“水豆腐”里打隧道的日子

5G、8K、AI……媒体未来什么样？记者探馆中国网络媒体论坛

深圳将实施重点行业领域降碳行动 促进城市绿色低碳发展

上海新增新冠本土病例，专家提醒来了

哈尔滨今冬冰雪旅游季启幕

深圳将实施重点行业领域降碳行动促进城市绿色低碳发展