大语言模型

5月31

  • GPT-4等大模型迎来进化转折点:会自己制作工具了

    10:14 作者:文瑞

    在人类的进化史中,制作和使用工具是关键的转折点。如今,在 Google Deepmind 等最新的研究中,大语言模型也具备了相似的能力,进化成了工具制作者。大语言模型(LLM)在广泛的 NLP 任务中已经表现出卓越的能力,甚至展现出能够实现通用人工智能某些方面的良好迹象。与人类的智能进化类似,LLM 在最近的研究中被揭示出使用外部工具从而提升解决问题能力及效率的潜力。人类进化的关键转折点是人类有能…

    AI觉醒日报
    分享到

5月28

  • 知乎发布最新大模型应用“搜索聚合”,即日开启内测

    11:06 作者:文瑞

    5月27日,知乎联合面壁智能发布了最新的大语言模型成果。知乎合伙人、首席技术官李大海表示,知乎模型应用“搜索聚合”即日开启内测,面壁智能研发的中文基座大模型CPM-Bee10b全面开源,并发布了对话类模型产品“面壁露卡”。(证券时报)

    AI觉醒日报
    分享到

5月27

5月25

5月23

  • 首个基于交互式网页搜索的中文问答开源框架,清华、人大、腾讯联合发布WebCPM

    09:44 作者:文瑞

    来自清华、人大、腾讯的研究人员共同发布了中文领域首个基于交互式网页搜索的问答开源模型框架 WebCPM。 这个模型框架特点在于:其信息检索基于交互式网页搜索,能够像人类一样与搜索引擎交互从而收集回答问题所需要的事实性知识并生成答案。这项工作已经被自然语言处理顶级会议ACL 2023录用,成为中文领域的重要突破。

    AI觉醒日报
    分享到

5月22

  • 全国首个DNA存储领域预训练大模型“ChatDNA”发布

    10:12 作者:文瑞

    上海人工智能研究院、祥符实验室、转化医学国家科学中心(上海)联合重磅发布全国首个DNA存储领域预训练大模型“ChatDNA”。围绕精准医学及生命科学前沿热点问题,诊断技术、基因测序等展开研究。

    AI觉醒日报
    分享到
  • 国产中文大语言模型“天河天元”发布:由天河超算训练

    10:12 作者:文瑞

    天河天元大模型涵盖小说、古文、百科、新闻、中医、法律等数据集,训练数据集总token数达到350B。天河E级智能计算开放创新平台,将带来突破百亿亿次的跨模态的超级计算算力。 支撑传统的科学工程计算,并服务智能混合计算,打造全方位的算力赋能创新和数字经济高质量发展载体。中文大语言模型的数据集非常稀缺。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以…

    AI觉醒日报
    分享到

5月11

  • 中科深智发布GenSense数智姜尚大模型

    09:12 作者:文瑞

    只需一块3090显卡即可驱动,比ChatGPT更轻量级,可私有化部署!中科深智大模型『GenSense数智姜尚』上线,是专为企业私有化部署和数字人设计的大语言模型,也是国内商用大模型在轻量化领域内的首次尝试。

    AI觉醒日报
    分享到
  • 谷歌发布AI语言模型PaLM 2

    08:18 作者:文瑞

    谷歌CEO桑达尔·皮查伊在谷歌I/O大会上发布其最新的人工智能(AI)语言模型“PaLM 2”,向OpenAI的GPT-4等竞争对手发起挑战。皮查伊称:“PaLM 2在逻辑和推理方面进行了广泛的训练,具有极强的逻辑和推理能力。同时,它还接受了多语言文本训练,支持100多种语言。”谷歌还称,PaLM 2已被用于支持自家的25项功能和产品,其中包括AI聊天机器人Bard,以及谷歌文档、幻灯片和工作表等…

    大语言模型
    分享到

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索
本网站由提供CDN加速/云存储服务