MaGGIe 推出了 I-HIM50K 和 M-HIM2K 数据集,包含超过 180,000 个合成人体遮罩,用于评估实例抠图的鲁棒性。MaGGIe 推出了 I-HIM50K 和 M-HIM2K 数据集,包含超过 180,000 个合成人体遮罩,用于评估实例抠图的鲁棒性。

Mensintesis Data Matting Manusia Pelbagai Contoh dengan MaskRCNN dan BG20K

Abstrak dan 1. Pengenalan

  1. Karya Berkaitan

  2. MaGGIe

    3.1. Matting Instans Berpandu Topeng yang Cekap

    3.2. Konsistensi Temporal Ciri-Matte

  3. Dataset Matting Instans

    4.1. Matting Instans Imej dan 4.2. Matting Instans Video

  4. Eksperimen

    5.1. Pra-latihan pada data imej

    5.2. Latihan pada data video

  5. Perbincangan dan Rujukan

\ Bahan Tambahan

  1. Butiran seni bina

  2. Matting imej

    8.1. Penjanaan dan penyediaan dataset

    8.2. Butiran latihan

    8.3. Butiran kuantitatif

    8.4. Lebih banyak keputusan kualitatif pada imej semula jadi

  3. Matting video

    9.1. Penjanaan dataset

    9.2. Butiran latihan

    9.3. Butiran kuantitatif

    9.4. Lebih banyak keputusan kualitatif

8. Matting imej

Bahagian ini mengembangkan proses matting imej, menyediakan pandangan tambahan mengenai penjanaan dataset dan perbandingan menyeluruh dengan kaedah sedia ada. Kami mendalami penciptaan dataset I-HIM50K dan M-HIM2K, menawarkan analisis kuantitatif terperinci, dan membentangkan keputusan kualitatif lanjut untuk menekankan keberkesanan pendekatan kami.

8.1. Penjanaan dan penyediaan dataset

Dataset I-HIM50K telah disintesis daripada dataset HHM50K [50], yang terkenal dengan koleksi luas matte imej manusia. Kami menggunakan model MaskRCNN [14] Resnet-50 FPN 3x, yang dilatih pada dataset COCO, untuk menapis imej satu orang, menghasilkan subset sebanyak 35,053 imej. Mengikuti metodologi InstMatt [49], imej-imej ini digabungkan dengan latar belakang pelbagai daripada dataset BG20K [29], mewujudkan senario berbilang instans dengan 2-5 subjek setiap imej. Subjek-subjek tersebut disaiz semula dan diletakkan untuk mengekalkan skala realistik dan mengelakkan pertindihan berlebihan, seperti yang ditunjukkan oleh IoU instans tidak melebihi 30%. Proses ini menghasilkan 49,737 imej, dengan purata 2.28 instans setiap imej. Semasa latihan, topeng panduan dijana dengan membinarkan matte alfa dan menggunakan operasi dropout rawak, dilasi, dan hakisan. Sampel imej daripada I-HIM50K dipaparkan dalam Rajah 10.

\ Dataset M-HIM2K direka untuk menguji ketahanan model terhadap kualiti topeng yang berbeza-beza. Ia terdiri daripada sepuluh topeng setiap instans, dijana menggunakan pelbagai model MaskRCNN. Maklumat lanjut mengenai model yang digunakan untuk proses penjanaan ini ditunjukkan dalam Jadual 8. Topeng-topeng tersebut dipadankan dengan instans berdasarkan IoU tertinggi dengan matte alfa kebenaran asas, memastikan ambang IoU minimum sebanyak 70%. Topeng yang tidak memenuhi ambang ini dijana secara buatan daripada kebenaran asas. Proses ini menghasilkan set menyeluruh sebanyak 134,240 topeng, dengan 117,660 untuk komposit dan 16,600 untuk imej semula jadi, menyediakan penanda aras teguh untuk menilai matting instans berpandu topeng. Dataset penuh I-HIM50K dan M-HIM2K akan dikeluarkan selepas penerimaan karya ini.

\ Rajah 10. Contoh dataset I-HIM50K. (Paling baik dilihat dalam warna).

\ Jadual 8. Sepuluh model dengan kualiti topeng berbeza digunakan dalam MHIM2K. Model MaskRCNN adalah daripada detectron2 yang dilatih pada COCO dengan tetapan berbeza.

\

:::info Pengarang:

(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);

(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).

:::


:::info Kertas kerja ini tersedia di arxiv di bawah lesen CC by 4.0 Deed (Attribution 4.0 International).

:::

\

市场机遇
Multichain 图标
Multichain实时价格 (MULTI)
$0.03833
$0.03833$0.03833
+2.98%
USD
Multichain (MULTI) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 service@support.mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

您可能也会喜欢

Ethena Labs 约 9 小时前向 Bybit 存入 1836 万枚 ENA 代币,价值 375 万美元

Ethena Labs 约 9 小时前向 Bybit 存入 1836 万枚 ENA 代币,价值 375 万美元

深潮 TechFlow 消息,12 月 20 日,据 Onchain Lens(@OnchainLens)监测,Ethena Labs(@ethena_labs)约 9 小时前向 Bybit 存入 1836 万枚 ENA 代币,价值 375 万美元。 2 年前 Ethena Labs 从 Gate 提取了 3465
分享
Tech Flow2025/12/20 09:07
美联储降息未能引发比特币涨势;期权到期迫近

美联储降息未能引发比特币涨势;期权到期迫近

联储降息未能引发比特币涨势;期权到期迫在眉睫的帖子出现在BitcoinEthereumNews.com。主要要点 Glassnode强调95%的比特币供应处于盈利状态,但较弱的现货流动和获利回吐正在造成脆弱的市场情绪。约30,000 BTC价值35.2亿美元的期权将于今日在Deribit到期,看跌/看涨比率呈看跌趋势。投资者正在为下跌做准备,然后BTC将继续前往新的历史高点。比特币BTC $116 873 24小时波动率:0.4% 市值:$2.33 T 24小时交易量:$36.34 B 价格在本周美联储降息25个基点后没有显示太多变动,并继续在$116,000水平徘徊。所有目光都集中在今天价值35亿美元的比特币期权到期上,这可能为下一步价格走势奠定基础。分析师认为BTC可能会在下一轮涨势开始前再次下跌。比特币价格在$117K遭遇强烈阻力 在Jerome Powell本周进行货币政策转向降息后,BTC波动性保持低迷,加密货币在$115K-$117K范围内徘徊。知名加密货币分析师Rekt Capital指出,比特币价格日线收盘突破$117,200非常重要。之后,BTC可能进一步上涨至$120,000水平,为下一轮涨势奠定基础。然而,如果未能收于$117,200上方,可能导致BTC大幅回调,甚至跌至$105K,如下图所示。#BTC 比特币能做到吗?比特币能日线收盘于~$117.2k以上,开始重新夺回蓝-蓝区间吗?距离新的日线收盘仅剩不到几个小时$BTC #Crypto #Bitcoin https://t.co/GJ3MAPkxw7 pic.twitter.com/eOrZU9fvnQ — Rekt Capital (@rektcapital) 2025年9月18日 区块链分析公司Glassnode指出,比特币价格保持在$115,200水平非常重要,以防止进一步下跌。该公司注意到,目前95%的流通供应处于盈利状态。...
分享
BitcoinEthereumNews2025/09/19 17:54
美司法部公布爱泼斯坦案调查文件,隐去上千名受害者及家属信息

美司法部公布爱泼斯坦案调查文件,隐去上千名受害者及家属信息

深潮 TechFlow 消息,12 月 20 日,据金十数据报道,美国司法部开始公布爱泼斯坦案相关的调查文件。司法部在其发布文件链接的网页上添加了一条说明,称已“尽一切合理努力”对受害者的个人信息进行编辑,但警告称,部分信息可能会无意中泄露。据悉,司法部副部长布兰奇在致国会的一封信件中表示,在对档案进行全面审查过程中,
分享
Tech Flow2025/12/20 09:01