20240416 每日AI必读资讯

🌐清华大学设计出用于通用人工智能的光子芯片:太极芯片
– 采用分布式光计算架构,具备亿级神经元的芯片计算能力,显著提高处理速度和能效。
– Taichi芯片能处理接近人类智能水平的复杂任务。
– Taichi能在高精度下处理复杂的分类和内容生成任务。
– 可应用与如自动驾驶、智能制造和高级机器人。
🔗新闻:https://www.tsinghua.edu.cn/en/info/1399/12830.htm
🔗论文:https://www.science.org/doi/10.1126/science.adl1203?ref=ai-recon.ghost.io
🔗 https://blink.csdn.net/details/1681350

🌍陶哲轩力荐!史上最全「数学AI资源」清单出炉
– 美国国家科学院「AI辅助数学推理」研讨会期间发起清单行动。
– 由UIUC的助理教授Talia Ringer进行整理。
– 从自学材料、论坛、工具,到研究平台的各种资源。
🔗文档地址:https://docs.google.com/document/d/1kD7H4E28656ua8jOGZ934nbH2HcBLyxcRgFDduH5iQ0/edit
🔗陶哲轩力荐!史上最全「数学AI资源」清单出炉-CSDN博客
 

图片

🎨比换脸更强大!SwapAnything:替换图片中的任意元素
– SwapAnything框架具有精确控制对象和部分、保留上下文像素、适应个性化概念等优势。
– 通过定向变量交换和外观调整技术,SwapAnything展现了精确和忠实的交换能力。
– SwapAnything能在图像中精确控制任意对象,实现高质量的个性化交换。
🔗项目入口:https://github.com/eric-ai-lab/swap-anything
🔗

🎮代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜
– Mini-Gemini模型在多模态任务上取得显著成绩,开源代码和模型数据。
– Mini-Gemini结合图像理解和生成,展现出色图像推理能力。
– 采用Gemini视觉双分支信息挖掘方法,有效处理高分辨率图像并生成内容丰富的视觉和文本内容。
🔗Github 地址:https://github.com/dvlab-research/MiniGemini
🔗Demo 地址: http://103.170.5.190:7860/
🔗论文地址:https://arxiv.org/pdf/2403.18814.pdf
🔗模型地址:https://huggingface.co/collections/YanweiLi/mini-gemini-6603c50b9b43d044171d0854
🔗数据地址:https://huggingface.co/collections/YanweiLi/mini-gemini-data-660463ea895a01d8f367624e

🤖面壁智能开源MiniCPM2.0系列模型 OCR等能力显著增强
– MiniCPM-V2.0是端侧最强的多模态模型,具有强大的OCR能力。
– MiniCPM-1.2B是适配端侧场景的基座模型,推理速度快成本低。
– MiniCPM-2B-128K是目前最小的长文本模型,处理128K文本内容。
🔗MiniCPM-V2.0:https://github.com/OpenBMB/MiniCPM-V
🔗MiniCPM系列开源地址:https://github.com/OpenBMB/MiniCPM
🔗MiniCPM技术Blog地址:https://openbmb.vercel.app/?category=Chinese+Blog

🖼️InstantID团队推新风格迁移方法InstantStyle 一键置身“梵高星空”
– 特征相减:利用CLIP模型的特性,通过特征相减去除内容信息,实现风格和内容解耦。
– 仅风格层注入:在特定风格层完成特征注入,实现风格和内容解耦。
– 通用性强:InstantStyle的方法具有通用性,提供丰富代码实现,支持多种应用场景。
🔗论文:InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation
🔗项目主页:https://instantstyle.github.io/
🔗代码链接:https://github.com/InstantStyle/InstantStyle
🔗Demo 地址:https://huggingface.co/spaces/InstantX/InstantStyle

图片

🎭用Gemini 1.5 Pro API和Raspberry Pi制作AI可穿戴设备原型机!
– 利用摄像头拍摄,Gemini 1.5 Pro实时回答任何看到的一切。
– 通过TTS转录成语音来用耳机接受回答内容。
🔗 http://GitHub:https://github.com/advaitpaliwal/insight
🔗 https://blink.csdn.net/details/1681364

版权声明:本文为博主作者:程序员的店小二原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/m0_46163918/article/details/137791252

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2024年4月22日
下一篇 2024年4月22日

相关推荐