视觉检测领先者
全国咨询热线:13812953225
产品中心
当前位置:首页 > 产品中心 > 视觉软件

云从科技获148家机构调研:公司已陆续在NLP、OCR、机器视觉、语音等多个领域开展预训练大模型的实践并持续加大投入沿袭ChatGPT的范式(附调研问答)

发布时间:2024-04-03 12:51:29   来源:下载雷火电竞亚洲先驱

云从科技2月1日发布投资者关系活动记录表,公司于2023年1月31日接受148家机构单位调研,机...

产品介绍

  云从科技2月1日发布投资者关系活动记录表,公司于2023年1月31日接受148家机构单位调研,机构类型为QFII、保险公司、其他、基金公司、海外机构、证券公司、阳光私募机构。

  问:请分享下AI的发展历史?AI行业发展到现在的ChatGPT与AIGC,整个行业是不是到了快速地发展的革命节点?

  答:(1)核心算法方面——长期以来有两个流派:数据派(需要更加多的数据来训练更大的模型)与知识派(加入人类知识,通过知识建立规则,向专家系统发展)。随着Deep Learning的发展,即2006年开始,数据派占优,大量数据会支撑模型优化,在计算机视觉上有突破性进展。2016年的代表Alpha Go带动资本浪潮,在AlphaGo时代,围棋上的成功并不能带来非常大现实应用,而ChatGPT带来的重要推进,是其现实应用更多,类似助理。

  (2)ChatGPT使用的模型与2年前发布的GPT3底层数据和参数规模一致,ChatGPT没有逐步扩大数据规模,而是突破性的引入了人的知识,即基于人类反馈的强化学习。以前监督学习的大数据训练也需要人为标注,标注比较初级,而ChatGPT的标注是来源于专业技术人员,把人类对各种问题最好的回答反馈进去,最大限度的在GPT的底层数据掘金,在某个具体的领域形成专业模型,把两个流派的技术路线很好的结合了起来。

  (3)未来ChatGPT的发展将得益于人机协同,其优点是:a)把人类的知识与数据的能力做更好的结合,使得各个落地场景的门槛降低;b)AI发展趋势就是技术平台化与应用场景化,如果技术非常场景化,通用性就变差,基础研下技术的高成本难以分摊,但是通过ChatGPT的范式,能做到核心技术的投入、算力、算法的通用化,人的标注能够迅速做场景的应用,边际效用增长,会大大加速各个行业的智能化升级。c)ChatGPT的成功铺开了未来AI大规模产业落地的道路,目前ChatGPT深入产业链处理问题,比AlphaGo更振奋人心。

  (4)至于整个AI技术与产业落地结合,可以用“一横一纵”来描述。a)一横:人的能力包含感知、认知、行动。关于认知体系,ChatGPT主要是认知的环节,不包含感知;关于感知体系,感知主要指云识别和CV,如果没有感知,物理和数字世界无法打通,而未来的大模型包含视觉、语音、自然语言的大模型,这才是未来的发展趋势;关于行动体系,从强到弱的人机交互逻辑有三种:托管(主要依赖于AI)、伴随(人和AI协同完成,双方随时讨论分析,需要感知、认知、计算机视觉等)、问答(以人为主,操作的流程中有问题通过语音或文字输入的方式询问AI,AI通过历史数据做多元化的分析并回答,需具备认知),前两种没办法实现是因为没有与物理世界打通。仅从软件角度来看,未来强AI一定要将视觉、语音、自然语言、大数据融入,软件逻辑需要横向打通。如果将软件结合实体,数字人与实体机器人打通,会带来非常大的突破,完成完整的横向逻辑。b)一纵:即产业链的发展,类似汽车厂商的产业链分工。Tier3:AI里的Tier3是大量要解决的技术点,场景、文字、行为等识别都是单点技术,都需要大量资源投入,由各个供应商来突破,通过SDK或者API来提供;Tier2:需要技术平台整合各种技术,比如通用视觉平台、语音平台、自然语言处理平台、拥有各种机器人组件的平台;Tier1:往上走还会有一层平台的平台,相当于汽车产业里能够为整车厂商提供系统总成和整车设计的角色,AI领域会出现数字人平台,可以支撑整个数字人的设计。数字人平台作为Tier1面向最终的场景应用则形成各种具体的数字人产品,比如家庭医生、造型设计师、健身专家等,就像汽车产业现在的主机厂商一样,可以制造各种款型的汽车。

  问:从训练的数据集、模型的体量来看,国内达到ChatGPT,包括模型能力、数据能力及标注能力,2年之内有没有可能形成对标ChatGTP的类似产品?

  答:从NLP角度来看,国内的的大模型数据量、参数规模不亚于ChatGPT,已达到千亿级数据,甚至数据量和模型都会更多。下一个要解决的问题依然是如何把人类的知识更好的接入,把基础大模型本身的威力释放开来。因此,对国内在近两年实现这方面的突破有信心。

  这个信心的来源:1)算力与数据量方面与美国相比尚不存在一定的差异。2)未来基于基础大模型,向上做教练模型、强化学习,形成专用模型,不一定要由少数大公司来做,可以由既掌握深度学习大模型的核心技术、又有行业理解的公司来做,形成生态,对于本身有AI布局的公司来说都是机会。3)公司在计算机视觉、语音、NLP上遵从模型和知识相结合的思路推进,理念上与OpenAI很大程度上是一致的。国内头部企业一定会沿着ChatGPT验证成功的这个范式来推进。

  问:GPT3.0和GPT3.5的差别很大,对于知识点的回应比较全面,GPT3.5距离通用型人工智能还有多远的距离?

  答:类比人来看,一个通才想要在某一个领域有所建树是很难的。今天我们正真看到的ChatGPT,已经具备了很好的语言组织的框架和逻辑,但是对于某个特定领域的理解不够深,会导致外行人看着觉得不错,内行人看着会觉得有所欠缺。如何提升专业度呢?一方面就是更大规模的专业数据,另一方面就是更专业的知识(深度的行业know-how)。让人工智能在某个方向上做得慢慢的变好,是一件很有趣的事情。在实际应用当中我们也不见得需要通才,一个家庭医生能帮我更好的应对生活中的健康问题,价值就已经很大了,我们不会要求他同时能做好发型。

  问:微软对此最感兴趣,Office和Bing上都会做投入,投资在百亿美金的级别,如何理解微软的行为?为什么微软最先做ChatGPT投资?是否因为在微软的生态下,商业化更容易实现?

  答:公司认为AI行业在技术上分为三个阶段。第一阶段(一浪时代):单点技术。如语音识别、人脸识别、车牌识别、OCR识别等每个单点发挥作用。第二阶段(二浪时代):多点技术组合。可以在较为复杂的领域解决实际问题。第三阶段(三浪时代):颠覆入口(颠覆交互方式,搜索的入口变革)和颠覆内容(AIDC,以丰富、更个性化的方式来生成内容)。微软投资动力一方面来自于颠覆过去的交互方式(AI对于未来入口的颠覆)。另一方面就是对内容的颠覆(AIGC能够以更快速、更丰富、更个性化的方式生成内容)。

  问:2023年虽疫情政策放开、政府政策加强和科技产业复苏,公司是不是迎来了快速地增长的拐点?大模型的预训练、ChatGPT、AIGC的底层算法的发展是否对业务有中长期促进作用?

  答:首先,坚持投入,在正确赛道上长期布局。AI的未来发展一定会对场景和产业形成效率和体验的全面提升,长期会坚持数据结合知识的趋势,坚持整个大模型、预训练、下游任务迁移的逻辑,自2020年开始,公司已陆续在NLP、OCR、机器视觉、语音等多个领域开展预训练大模型的实践并持续加大投入,沿袭ChatGPT的范式。其次,公司致力于人机协同,将更多人类的专业领域知识加入到原始数据中。公司依然坚持即定战略,致力于打通从感知-认知-行动的人机协同操作系统。最后,就是技术平台化与应用场景化。公司可通过行业的know-how将公司本身的算法模型提高到更高的水平,也能够最终靠这个方式形成范式。技术平台化以后,解决方案的标准化程度将提升,可复制性变强且成本降低。

  答:从技术角度看,目前视觉大模型、语音大模型跟自然语言理解大模型是分开的,尚且不存在一个通用的大模型解决全部问题,但ChatGPT在技术范式上给视觉、语音大模型的发展带来非常大的能量。单独看NLP大模型,能当成百科全书来用,在搜索引擎的场景对用户的帮助是很直接的,不过局限在线年,我们会发现,把视觉、语音和NLP结合在一起,变成数字人,能打通线上和线下,结合实时与非实时,可以在一定程度上完成问答、伴随和托管等更多的人机协作模式,可以帮助到更多的场景。

  答:这是技术临界点与场景临界点的问题。就是当技术到达一定临界点的时候,场景端不一定真正被大众所接受(未必达到场景临界点),并且AI公司需要靠技术去积累。

  答:工业城市与旅游城市的需求是不一样的。以智慧水务解决方案为例,大致用来解决以下三个问题:(1)在一些重要的河道或重点区域安装传感器去检测数据的变化以及水位的变化,预测是否会出现内涝以及由此产生的潜在自然灾害与后果。(2)防汛的应急预案,包括调用应急预案的合理时间与调用应急预案所需的资源。(3)现场应急抢险中,如何现场指挥、如何分配资源、如何最精准的了解各个现场的现状、如何根据现场复杂情况作出应急方案的调整以及预测随时有可能发生的潜在灾害。

  行业解决方案要解决的是事态的感知、智能的预判以及统筹调度(即快速察觉缺陷、解决客户痛点问题、甚至提前预防问题)。四川成都天府凭借企业来提供的智慧城市解决方案荣获由全球智慧城市大会颁发的“能源与环境大奖”。

  技术难点:人工智能场景落地时,需要基础的范式。第一步,对现场检测的环境进行感知(即物理世界数字化)。只有充分掌握复杂环境的各种数据,才能在后续的阶段提供更高效的解决方案。此步骤需要识别大量case,要求需具备包括视觉语音等更全面的人工智能技术。面对新场景时,要求需以更高效更快速且更低成本的去检测与识别新内容。第二步,知识构建与计算的过程(包括事态的感知、预案的判断),这是需要大量行业know-how。第三步,当应急事件发生后,需要对应急指挥进行辅助,包括资源调度、现场情况判断、联合指挥等。这就需要AI技术的陪伴或执行,即“感知-认知-行动”中的行动。总的来看,需要全面的技术链条支撑与高生产效率的技术能力。

  问:公司在ChatGPT领域的技术储备情况与技术布局,产业链方面的商业化?

  答:ChatGPT对于AI行业是振奋人心的,技术上面是跨越式的进步,给AI行业场景落地带来了更多想象空间。ChatGPT把数据与人类知识有机结合在一起,使得模型性能大幅度的提高,给未来的人机交互带来了巨大的提升,因此降低各个应用场景的门槛并提升了效率。

  首先,公司的研究团队高度认同“预训练大模型+下游任务迁移”的技术趋势,从2020年开始,已经陆续在NLP、OCR、机器视觉、语音等多个领域开展预训练大模型的实践,不仅逐步提升了公司各项核心算法的性能效果,同时也大幅度的提高了公司的算法生产效率,已经在城市治理、金融、智能制造等行业应用中体现价值;其次,公司一直以来都在人机协同领域布局,打造了像人一样思考和工作的人机协同操作系统(CWOS),致力于整合打通视觉、语音、NLP等多个领域的大模型,不止于像ChatGPT那样在文本世界实现超级智能,还要彻底打通数字世界和物理世界,为“像人一样思考和工作”打下坚实的技术基础;公司也通过开放的人机协同操作系统实现了技术平台化,加上多年的行业深耕,可以通过“平台化的通用模型+带行业knowhow的专用模型”来帮助各行各业快速实现智能化升级。

  答:从技术上来看,公司期待技术间的交流与合作,公司认为不能闭门造车,需开放拥抱。国内整个技术领域里,算力与数据量方面与美国相比尚不存在一定的差异,芯片方面的差距还是存在的,公司也希望与国外头部公司进行交流与合作;

  云从科技集团股份有限公司从事AI算法研究及应用,面向客户提供人机协同操作系统和人工智能解决方案。基本的产品或服务包括人机协同操作系统、人工智能解决方案。公司及核心技术团队曾先后9次获得国内外智能感知领域桂冠,并于2018年获得了“吴文俊人工智能科技进步奖一等奖”。公司受邀参与了人工智能国家标准、公安部行业标准等26项国家和行业标准制定工作,并同时承担国家发改委“人工智能基础资源公共服务平台”和“高准确度人脸识别系统产业化及应用项目”、工信部“基于自研SoC芯片的高准确度人脸识别产业化应用”等国家级重点项目建设任务。

  投资者关系关于同花顺软件下载法律声明运营许可联系我们友情链接招聘英才使用者真实的体验计划

  不良信息举报电话举报邮箱:增值电信业务经营许可证:B2-20090237