MeshNet Latent space

August 20, 2023 less than 1 minute read

Introduction

DeepSDF: Learning Continuous Signed Distance Functions for Shape Representation

text to 3d

3dfy
- text to 3d, image to 3d
- objects
  - interiors: table lamps、sofa、table、ottoman、cutlery
  - gaming：sword、shield、axes
- 提供API
- 面像对象：GTA
- 架构和技术方案(没有具体写参照的论文)
DreamFusion - google
- 平均1.5小时
- 文本->2D图像->优化为Nerf
  - Score Jacobian Chaining(目前几乎所有的零样本开放域文生 3D 工作所使用的算法)
  - 问题：过于平滑、过饱和现象严重
- stable-dreamfusion
  - python + cuda
  - A pytorch implementation of the text-to-3D model Dreamfusion
- prolificdreamer - 清华 2023
  - Paper
  - Code: release soon
  - DataSet: LAION-5B
    - A dataset consisting of 5.85 billion CLIP-filtered image-text pairs, featuring several nearest neighbor indices, an improved web-interface for exploration and subset generation, and detection scores for watermark, NSFW, and toxic content detection.
  - VSD(Variational Score Distillation)变分得分蒸馏 + Nerf
  - 将3D优化转为2D图像概率分布
  - 解决了 DreamFusion 所提 SDS 算法的过饱和、过平滑、缺少多样性等问题
- 开发者社区机器之心文章正文无需任何3D数据，直接文本生成高质量3D内容，清华朱军团队带来重大进展 - 阿里云
Magic3D - Nvidia
- 平均40分钟
- 一句话生成3D模型！NVIDIA提出Magic3D：高分辨率文本到3D内容创建 - CSDN
- Magic3D提出了一个两阶段的优化框架，通过使用不同分辨率的扩散先验进行粗到精的优化过程。这使得Magic3D能够生成更高分辨率的几何体和纹理。而DreamFusion在这方面存在限制，无法获取高分辨率的几何体和纹理。
- Magic3D采用了一种多分辨率哈希网格编码架构，使用具有32个隐藏单元的单层MLP来预测RGB颜色、体积密度和法线。同时，Magic3D还引入了密度基础剪枝方法来稀疏表示，并通过密度偏置来优化粗糙神经场表示。
Shap-E: Generating Conditional 3D Implicit Functions - 2023 - OpenAI
- dataset：貌似是私有的
- 隐式空间的编码器训练
  - 点云->点卷积->交叉注意力->patch->隐式空间的编码表示
- Latent Diffusion 条件扩散模型
Point-E: A System for Generating 3D Point Clouds from Complex Prompts - OpenAI
- text -> point cloud -> mesh(based on sdf)
- 基于文本生成合成视图，基于合成视图生成粗糙的点云，最后根据低分辨率点云和合成视图生成精细的点云。
- 条件扩散模型