投稿问答最小化  关闭

万维书刊APP下载

学界研圈

71043条记录

  • 60291.nuScenes 纯视觉新SOTA!SOLOFusion:时序立体3D检测的新观点和基线

    [摘要]:1摘要虽然最近基于纯视觉的3D检测方法利用了时序信息,但它们使用的有限历史信息限制了时序融合性能提升的上限。论文观察到现有多帧图像融合的本质是时序立体匹配,且目前算法的性能受到以下因素影响:1)匹配分辨率的低粒度;2)有限历史信息的使用产生的次优多目设置。论文的理论和实验分析表明,不同像素和深度的视图之间的最优时间有显著差异,因此有必要融合长期历史上的多个时间戳信息。基于此,论文建议从长期的图像观... [发表时间:2022/10/26 11:30:03]

  • 60300.精度超越ConvNeXt的新CNN!HorNet:通过递归门控卷积实现高效高阶的空间信息交互

    [摘要]:转载|极市平台作者丨科技猛兽编辑丨极市平台导读 本文提出了一种基于递归的门控卷积的通用视觉模型,是来自清华大学周杰老师,鲁继文老师团队,以及MetaAI的学者们在通用视觉模型方面有价值的探索。本文目录1HorNet:通过递归门控卷积实现高效高阶的空间信息交互(来自清华大学,周杰,鲁继文团队,MetaAI)1.1HorNet原理分析1.1.1背景和动机1.1.2HorNet简介1.1.3 Conv:... [发表时间:2022/10/26 11:23:28]

  • 60294.See Finer, See More!腾讯&上交提出IVT,越看越精细,进行精细全面的跨模态对比!

    [摘要]:SeeFiner,SeeMore!腾讯&上交提出IVT,越看越精细,进行精细全面的跨模态对比!【写在前面】基于文本的人员检索是基于文本描述来查找查询对象。关键是要学会在视觉-文本模态之间建立一种共同的潜在空间映射。为了实现这一目标,现有的工作利用分割来获得明确的跨模态对齐或利用注意力来探索显著的对齐。这些方法有两个缺点:1)标记跨模态对齐是耗时的。2)注意力方法可以探索显著的跨模态对齐,但可能会忽... [发表时间:2022/10/26 11:27:16]

  • 60293.MIT开发的这个无监督康复系统,能让你“看到”肌肉训练和恢复情况!华人学者一作

    [摘要]:大数据文摘出品作者:Caleb9月下旬,在对阵亚特兰大的比赛中,阿根廷前锋迪巴拉由于左腿屈肌出现问题遗憾缺席,在队内进行了几天的康复训练。可以说是让好些球迷小捏了把汗。其实不只是对运动员,即使是普通民众,在受伤后进行康复训练的恢复速度与恢复效果都恨不得精确到每秒钟。现在就有一个系统能够通过对受损与康复大腿肌肉的可视化,来帮助患者更好地了解他们的康复训练情况,也有助于根据这些统计数据更好地评估目前的... [发表时间:2022/10/26 11:27:54]

  • 60298.PointCLIP: 利用CLIP高效处理三维点云

    [摘要]:1.论文信息标题:PointCLIP:PointCloudUnderstandingbyCLIP作者:RenruiZhang,ZiyuGuo,WeiZhang,KunchangLi,XupengMiao,BinCui,YuQiao,PengGao,HongshengLi原文链接:https://arxiv.org/abs/2112.02413代码链接:https://github.com/ZrrS... [发表时间:2022/10/26 11:24:43]

  • 60297.ECCV 2022 Oral | HuMMan:多样化感知与建模的多模态4D人体数据集

    [摘要]:导读人的4D感知与建模是计算机视觉和图像学的基本任务,也有着广泛的应用。随着新传感器与算法的出现,对多样化的数据集的需求也日渐提升。在这个工作中,本文贡献了HuMMan:一个大规模多模态4D人体数据集。HuMMan包含1000个人物,40万段视频,6000万帧数据。HuMMan有着多个优势:1)多模态数据和标注包括彩色、点云、关键点、SMPL参数以及带纹理的网格模型;2)数据采集方案中部署了移动端... [发表时间:2022/10/26 11:25:33]

  • 60292.NeRFusion | 用于大规模场景重建的融合辐射场

    [摘要]:以下文章来源于深圳大学可视计算研究中心,作者谢志丹导读本文是VCC谢志丹同学对论文NeRFusion:FusingRadianceFieldsforLarge-ScaleSceneReconstruction的解读,该工作来自加州大学圣地亚哥分校和Adobe研究所,并已发表在计算机视觉和模式识别领域顶级会议CVPR2022上。项目主页:https://jetd1.github.io/NeRFusi... [发表时间:2022/10/26 11:29:14]

  • 60295.ECCV 2022 Oral | HuMMan:多样化感知与建模的多模态4D人体数据集

    [摘要]:人的4D感知与建模是计算机视觉和图像学的基本任务,也有着广泛的应用。随着新传感器与算法的出现,对多样化的数据集的需求也日渐提升。在这个工作中,本文贡献了HuMMan:一个大规模多模态4D人体数据集。HuMMan包含1000个人物,40万段视频,6000万帧数据。HuMMan有着多个优势:1)多模态数据和标注包括彩色、点云、关键点、SMPL参数以及带纹理的网格模型;2)数据采集方案中部署了移动端设备... [发表时间:2022/10/26 11:26:42]

  • 60296.NVRadarNet:基于纯Radar的障碍物和可行驶区域检测(英伟达最新)

    [摘要]:NVRadarNet:基于纯Radar的障碍物和可行驶区域检测论文地址:https://arxiv.org/abs/2209.14499源码:暂未公布效果展示:https://youtu.be/WlwJJMltoJY一、摘要最近特斯拉提出的OccupancyNetworks引起了一些讨论,本篇论文也提出了一个occupygrid预测的网络,不过相关性并不大。回到正题,作者基于毫米波的问题:识别静态... [发表时间:2022/10/26 11:26:10]

  • 60299.Simple-BEV: 多传感器BEV感知真正重要的是什么?(斯坦福大学最新)

    [摘要]:Simple-BEV:WhatReallyMattersforMulti-SensorBEVPerception?不依赖高密度激光雷达的无人驾驶车辆,构建3D感知系统是一个很关键的问题,因为与camera和其他传感器相比,激光雷达系统的成本较高。最近的工作开发了多种仅camera的方法,其中特征可从多camera图像“提升”到2Dgroundplane,从而生成3D空间的“鸟瞰图”(BEV)特征表... [发表时间:2022/10/26 11:24:07]

首页<<6027602860296030603160326033>>尾页共7105页 跳页共71043条记录
  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com