您现在的位置: 首页 » 新闻动态 » 讲座信息 » 正文

新闻动态

讲座信息

老版大阳城网站系列讲座名家讲坛第4期——2D and 3D Recognition with Transformers

           

报告题目(Title)2D and 3D Recognition with Transformers

 

时间(Date & Time)2023.7.13     下午3:30-4:30

 

地点(Location)理科二号楼2135

 

主讲人(Speaker)王井东

 

邀请人(Host)张史梁

 

报告摘要(Abstract)

 

Transformer已经成为视觉识别的主流网络,可以用作编码器和解码器。本报告首先介绍探索transformer编码器和卷积编码器的关系的工作DWNet。然后介绍基于querytransformer解码器在语义分割中应用OCRNet。最后,分享基于transformer解码器的目标检测的方法Group DETR、以及多视图3D目标检测方法CAPE

 

主讲人简介(Bio)

 

王井东,百度计算机视觉首席科学家,负责计算机视觉领域的研究、技术创新和产品研发。加入百度之前,曾任微软亚洲研究院视觉计算组首席研究员。2001年和2004年在清华大学获得学士和硕士学位,2007年在香港科技大学获得博士学位。研究领域为计算机视觉、深度学习及多媒体搜索。他的代表工作包括高分辨率神经网络HRNet、基于transformer的图像语义分割网络OCRNet、以及基于近邻图的大规模最近邻搜索SPTAG(最早把近邻图的方法用于实际搜索和推荐业务,是Bing搜索底层向量搜索的核心技术)等。在微软工作期间,科研成果10多次转化到微软的关键产品和业务中去,包括搜索、广告、OCR、小冰聊天机器人等。在百度带领团队研发的技术已经广泛应用于百度的搜索、智能云以及自动驾驶等重要产品和业务中。

他曾担任过许多人工智能会议的领域主席,如 NeurIPSCVPRICCVECCVAAAIIJCAIACM MM等。他现在是IEEE TPAMIIJCV的编委会成员,曾是IEEE TMMIEEE TCSVT编委会成员。因在视觉内容理解和检索领域的杰出贡献,他被遴选为国际电气电子工程师学会和国际模式识别学会会士 (IEEE/IAPR Fellow)、国际计算机协会杰出会员 (ACM Distinguished Member)

 

 

 

欢迎关注老版大阳城网站微信公众号,了解更多讲座信息!

 

老版大阳城网站(中国)有限公司