必威官方网站,Betway必威,必威APP下载
在人工智能时代,高校统计学人才的培养理念、培养内容和培养模式也在不断革新。李扬认为,在培养理念方面,要找准定位,坚持夯实理论基础,并提升学生面对真实场景的数据处理与分析能力。同时,要处理好统计思维和人工智能现实需求之间的关系,以及课堂学习和课外实践之间的关系。在培养内容方面,一方面要重视经典的统计模型与技术,打牢基础;另一方面,视角要随时代发展更新,将前沿的方法和理念融入基础性课堂,引导学生将知识转化为数据治理的能力。
“大学校园里,既要关注拔尖学生,更要关注多数学生能力的培养,如何兼顾一部分学生‘吃不饱’、另一部分学生‘消化好’的挑战,需要教育工作者不断探索。一方面,优化课堂教学,保障基础知识与技能的培养。另一方面,在课堂外构建全面的训练体系,打造融合‘课程训练、研学训练、会议训练、竞赛训练、实践训练’的‘五训’培养体系,让所有学生基础学习有保障,并且能够个性化地提升能力。”李扬介绍,中国人民大学统计学院下学期将开设一门“AI赋能统计思维”的通识公共课,除了讲授数据思维等基础内容外,还专门邀请老师分享运用人工智能与数据科学帮助各行业解决实际问题的案例,让学生结合真实场景去思考,使用真实数据去探索,培养他们解决实际问题的能力。
张向宏介绍,去年发布的《国家数据基础设施建设指引》,提出了数场、可信数据空间、数联网、隐私保护计算、区块链和数据元件等6条技术路线个地方进行试点试验,在25个地方进行互联互通。当前,全国18个地方试点建设初见成效,今年第二批42个地方试点也将马上启动,无论是从数据的可信流通环境,还是在跨区域、跨行业、跨主体的互联互通,以及在培育数据的供需主体、应用主体和数据中介的服务处理主体等方面都取得了非常大的进展。
张向宏表示,近年来,人工智能和数据资源开发在探索数据要素化、价值化过程中取得了巨大成就。尤其是今年DeepSeek出现后,人工智能在千行百业具体落地的场景越来越多,这样的突破来源于人工智能三要素,即算力、算法和数据。DeepSeek实现了算力平权和算法平权,就面临着第三个障碍——数据。从今年开始,高质量数据集成了全社会关注焦点,并且也得到了国家有关部门的重视和推动,人工智能高端数据集中心现在星罗棋布,不过大多属于作坊化生产阶段,高质量数据集厂商规模不大、水平不高。另外,公开数据、加工数据方面也有改进的空间。
如何应对AI时代的数据安全挑战?刘博认为,首先,在大模型训练过程中,尽量不要让其接触敏感信息,可以通过智能化手段、智能化分类分级,在智能语料里保证数据的可靠性。其次,在构建AI应用时,当下大模型应用可能背后有几十个服务机构,要保证数据在通信等过程中不会因为意外或者是恶意情况下被泄露,安恒信息有专门MAF大模型应用防火墙保证其安全。MAF能够避免在使用大模型服务过程中的恶意请求,保证自身的行为安全。最后,在大模型上线前要做全面体检,并且及时修复,上线后要保证大模型运行中实时安全。
此前刘博曾提出“数据安全需与企业信息化同等高度”“数据要素市场建设必须安全先行”等观点,刘博表示,一方面数据是政企单位重要资产,一旦发生数据泄露,对知识产权、重要软件资产、重要客户数据等会造成巨大影响和损失。另一方面,从国家层面讲,产生数据泄露,根据《中华人民共和国数据安全法》要负相关法律责任,做到数据安全也是政企单位应该履行的责任和义务。如果涉及个人隐私数据或者国家重要数据,会产生严重后果,所以和之前网络安全相比,数据安全要跟信息化或者智能化同步进行。
随着大模型普及、数据流通激增和垂域智能化加深,安全防护边界已延伸至AI全生命周期,数据安全的内涵也拓展为“安全和增值”,该如何理解“AI全生命周期”与“安全和增值”概念?刘博解释,AI大模型就是现在最重要的应用之一,大模型利用了新一代的人工智能算法、架构,并且有大量高质量的数据,能够把几亿人积累了几十年的知识经验浓缩到一个大模型里,所以大模型包含了大量敏感和关键的数据或者是信息,所以在构建大模型应用时,数据安全问题就会发生。从技术层面讲,在训练大模型中会录入敏感信息,从而产生数据安全问题。另外,把垂域知识弥补到通用大模型里,也会产生很多数据泄露的风险。
陈曦介绍,从2023年开始,公司建设了药品追溯平台,打通了生产、流通、使用的所有环节,在此基础上,在药监局的指导下,共同推出国家级药品行业可信数据空间。“药品安全广受大家关注,是关系民生的重要行业。我们希望通过空间的建设,首先推动建立共管、共治模式,通过联盟形式对空间进行治理;其次,希望子空间先行,在药品领域挑选较为成熟的医药品先做探索;再次,通过开展白名单制进行试点推进。”陈曦说,目前,公司药品追溯已经实现重要品种覆盖,空间运营公司也与行业相关主体开展了相应的探索研究,正积极落地推进中。
对于企业基于AI开展数字化转型,杨安培建议企业应重视以下方面:第一,企业要清晰知晓所运用的AI模型的能力范围和局限性,避免因对模型能力认知不清而导致应用偏差;第二,企业需要定制AI转型的顶层规划,该规划需明确应用场景,规划数字治理与服务治理工作;第三,企业需认知AI应用的运营属性,在2B场景的AI应用中,需明确AI应用并非建成后就一劳永逸,而是需要通过运营不断完善;最后,企业应算好账,AI模型在使用过程中会产生一定成本,无论是基于公有云还是私有部署,都需确保AI应用的投入与产出相匹配,避免盲目投入导致资源浪费。
靳博阳表示,数字化和绿色化是两个长期并行不悖的趋势,数字化可以作为“双化协同”的基座,因为很多政策都必须基于可信的、有参考价值的数据。例如,地方政府可以根据公用事业类企业的数据网,以数字化为底座,根据地方实际,像搭积木一样构建地区能源绿色转型政策规划,更加科学合理;反过来,数据产业本身也是一个用能大户,很多企业的数据中心用电量都非常大,它们也面临绿色转型的压力,也需要购入绿电或绿证来降低自身碳排放。在政策的引导下,公用事业类企业能够帮助数据行业企业,利用大数据、AI模型等技术降低数据行业碳排放,这将是一件两全其美的事情。
“基于区块链技术的去中心化以及不可篡改的特性,对于企业报告自身碳排放数据的准确性能够起到一个非常强的加持作用。目前,欧盟与英国等经济体在推行碳边境税的过程中,由于尚未完全认可我国碳排放数据的准确性,导致其数据库中针对中国企业的碳排放强度缺省值普遍畸高,这将给企业造成沉重的碳税负担。通过这些新技术,不仅能让企业获得国家乃至世界都更为认可的、准确性更高的碳排放数据,还能间接提升企业的碳管理及环境、社会和公司治理水平,为企业降低碳税和融资成本,这是尤为重要的。”靳博阳说。
廖圣强说,在数据产业迅猛发展的背景下,随着数据交易活跃度提升,“交易合规”成为核心前提,企业需通过尽职调查确保数据来源合法,严格禁止非法数据买卖,且收集处理数据必须遵循“数据主体知情同意”原则。同时,AI技术的快速发展催生了新的法律挑战。数据用于大数据推理、大语言模型训练后,新生成内容的版权问题、合规问题日益复杂,全球范围内相关法律诉讼已逐步增多,成为行业关注的热点。未来,随着底层商业交易模式的创新,数据法律需求将持续迭代,围绕数据权属界定、AI生成内容合规、跨境监管协同等领域的新需求将不断涌现。