国家工程技术图书馆第一分馆 | 机械分馆 | 机械工业信息研究院 | library.gmachineinfo.com | 全球机械文献资源网

会议文集

文集名	Computer Vision - ECCV 2024
会议名	18th European Conference on Computer Vision (ECCV 2024)
中译名	《第十八届欧洲计算机视觉会议，卷10》
机构	European Computer Vision Association (ECVA)
会议日期	September 29 - October 4, 2024
会议地点	Milan, Italy
出版年	2025
馆藏号	354363

题名

作者

出版年

Modeling and Driving Human Body Soundfields Through Acoustic Primitives

Chao Huang; Dejan Markovic; Chenliang Xu; Alexander Richard

2025

m&m's: A Benchmark to Evaluate Tool-Use for multi-step multi-modal Tasks

Zixian Ma; Weikai Huang; Jieyu Zhang; Tanmay Gupta; Ranjay Krishna

2025

Label-Anticipated Event Disentanglement for Audio-Visual Video Parsing

Jinxing Zhou; Dan Guo; Yuxin Mao; Yiran Zhong; Xiaojun Chang; Meng Wang

2025

High-Fidelity 3D Textured Shapes Generation by Sparse Encoding and Adversarial Decoding

Qi Zuo; Xiaodong Gu; Yuan Dong; Zhengyi Zhao; Weihao Yuan; Lingteng Qiu; Liefeng Bo; Zilong Dong

2025

Semi-supervised Video Desnowing Network via Temporal Decoupling Experts and Distribution-Driven Contrastive Regularization

Hongtao Wu; Yijun Yang; Angelica I. Aviles-Rivero; Jingjing Ren; Sixiang Chen; Haoyu Chen; Lei Zhu

2025

I-MedSAM: Implicit Medical Image Segmentation with Segment Anything

Xiaobao Wei; Jiajun Cao; Yizhu Jin; Ming Lu; Guangyu Wang; Shanghang Zhang

2025

ReMamber: Referring Image Segmentation with Mamba Twister

Yuhuan Yang; Chaofan Ma; Jiangchao Yao; Zhun Zhong; Ya Zhang; Yanfeng Wang

2025

TalkingGaussian: Structure-Persistent 3D Talking Head Synthesis via Gaussian Splatting

Jiahe Li; Jiawei Zhang; Xiao Bai; Jin Zheng; Xin Ning; Jun Zhou; Lin Gu

2025

CAT: Enhancing Multimodal Large Language Model to Answer Questions in Dynamic Audio-Visual Scenarios

Qilang Ye; Zitong Yu; Rui Shao; Xinyu Xie; Philip Torr; Xiaochun Cao

2025

Segmentation-Guided Layer-Wise Image Vectorization with Gradient Fills

Hengyu Zhou; Hui Zhang; Bin Wang

2025

Implicit Style-Content Separation Using B-LoRA

Yarden Frenkel; Yael Vinker; Ariel Shamir; Daniel Cohen-Or

2025

OpenPSG: Open-Set Panoptic Scene Graph Generation via Large Multimodal Models

Zijian Zhou; Zheng Zhu; Holger Caesar; Miaojing Shi

2025

ActionVOS: Actions as Prompts for Video Object Segmentation

Liangyang Ouyang; Ruicong Liu; Yifei Huang; Ryosuke Furuta; Yoichi Sato

2025

FALIP: Visual Prompt as Foveal Attention Boosts CLIP Zero-Shot Performance

Jiedong Zhuang; Jiaqi Hu; Lianrui Mu; Rui Hu; Xiaoyu Liang; Jiangnan Ye; Haoji Hu

2025

U-COPE: Taking a Further Step to Universal 9D Category-Level Object Pose Estimation

Li Zhang; Weiqing Meng; Yan Zhong; Bin Kong; Mingliang Xu; Jianming Du; Xue Wang; Rujing Wang; Liu Liu

2025

Integrating Markov Blanket Discovery Into Causal Representation Learning for Domain Generalization

Naiyu Yin; Hanjing Wang; Yue Yu; Tian Gao; Amit Dhurandhar; Qiang Ji

2025

Rotary Position Embedding for Vision Transformer

Byeongho Heo; Song Park; Dongyoon Han; Sangdoo Yun

2025

Local All-Pair Correspondence for Point Tracking

Seokju Cho; Jiahui Huang; Jisu Nam; Honggyu An; Seungryong Kim; Joon-Young Lee

2025

MonoWAD: Weather-Adaptive Diffusion Model for Robust Monocular 3D Object Detection

Youngmin Oh; Hyung-Il Kim; Seong Tae Kim; Jung Uk Kim

2025

ReALFRED: An Embodied Instruction Following Benchmark in Photo-Realistic Environments

Taewoong Kim; Cheolhong Min; Byeonghwi Kim; Jinyeon Kim; Wonje Jeung; Jonghyun Choi

2025

1

国家科技图书文献中心全球文献资源网京ICP备05055788号-26 京公网安备11010202008970号机械工业信息研究院 2018-2024