Navigation menu

新闻中心

豆包视觉理解模型发布

    科技日报讯 (记者杨雪)克日,字节跳动在火山引擎原能源年夜会上宣布豆包视觉懂得模子,为企业供给多模态年夜模子才能。豆包视觉懂得模子千词元(tokens)输入价钱仅为3厘,1元钱就可处置284张720P的图片,比行业均匀价钱廉价85%,以更低本钱推进AI技巧普惠跟利用开展。    火山引擎总裁谭待先容,豆包视觉懂得模子经由过程算法、工程等技巧翻新,年夜幅优化应用本钱。该模子不只能精准辨认视觉内容,还具有杰出的懂得跟推理才能,可依据图像信息停止庞杂的逻辑盘算,实现剖析图表、处置代码、解答学科成绩等义务。    此前,豆包视觉懂得模子曾经接入豆包App跟PC端产物。豆包策略研讨担任人周昊表现,为了让用户的输入更快更便利,豆包十分重视多模态的输入跟打磨,包含语音、视觉等才能,这些模子都已经由过程火山引擎开放给企业客户。    数据表现,停止12月中旬,豆包通用模子的日均tokens应用量已超越4万亿,较7个月前初次宣布时增加了33倍。年夜模子利用正在向各行各业减速浸透。    据悉,豆包年夜模子曾经与八成主流汽车品牌配合,并接入多家手机、PC等智能终端,笼罩终端装备约3亿台,来自智能终真个豆包年夜模子挪用量在半年时光内增加达100倍。    “豆包年夜模子挪用量的高速增加,是市场疾速开展的一个缩影。年夜模子在种种场景中都在片面着花,尤其是跟企业出产力相干的场景。”谭待先容,近来3个月,豆包年夜模子在信息处置场景的挪用量增加了39倍,客服与贩卖场景增加16倍,硬件终端场景增加13倍,AI东西场景增加9倍,进修教导等场景也有年夜幅增加。   申明:新浪网独家稿件,未经受权制止转载。 -->