环球要闻:最大CLIP!LAION发布CLIP的扩增定律

  2022-12-25 23:12:32


(相关资料图)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

相关新闻

猜你喜欢

环球要闻:最大CLIP!LAION发布CLIP的扩增定律

2022-12-25

悦康药业(688658)270万股限售股将于12月26日解禁上市,占总股本0.6%

2022-12-25

国家药监局两周连批10个抗原检测试剂,厂商集体扩产稳价保供 全球快播

2022-12-24

天天观焦点:正裕工业: 北京植德(上海)律师事务所关于浙江正裕工业股份有限公司2022年第一次临时股东大会的法律意见书

2022-12-23

2023年春运火车票明起开售 热门

2022-12-23

天天热议:青鸟消防(002960)12月22日主力资金净卖出220.06万元

2022-12-23

小期贷网贷逾期52年不还会上征信吗_全球聚焦

2022-12-22

零下20℃踏雪巡边_今日热搜

2022-12-22

晶华微(688130)12月21日主力资金净卖出176.55万元

2022-12-22

acca就业前景好吗?薪资待遇怎么样?

2022-12-21

动态:年轻人第一款高定奢品 米家智能调香机套装开启众筹

2022-12-21

协程这么好,它能完全代替线程么?

2022-12-21

善水科技(301190.SZ):1738.69万股限售股将于12月26日解禁-今日热闻

2022-12-20

闽江干流“黄金航道”今起全线恢复通航 500吨级货船通江达海

2022-12-20

中航重机(600765)1.07亿股限售股将于12月21日解禁上市,占总股本7.25%-环球新消息

2022-12-20

世界快报:神驰机电: 关于参加“重庆辖区2022年投资者网上集体接待日活动”的公告

2022-12-19

每日热议!异动快报:创益通(300991)12月19日10点10分触及涨停板

2022-12-19

鹿邑:这个曾经的“落后村”获得了人居环境整治流动红旗

2022-12-19

Transphorm按功率段发布氮化镓功率管可靠性评估数据 天天热资讯

2022-12-18

Fender限时体验所落座上海张园 众多热门琴款开放体验 当前滚动

2022-12-17

每日热文:阿胶煮多久 阿胶煮多长时间能熟

2022-12-17

化妆卡粉是干皮还是油皮 化妆卡粉是因为缺水吗

2022-12-16

如何看待M2-M1缺口变大?-今日快看

2022-12-16

台媒:鸿海13.62亿元新台币投资布局研发电动车用第三代半导体-每日时讯

2022-12-15

亚马逊已预订《战神》将推出真人电视剧

2022-12-15

精彩图集