Weekly #041
文章推荐
Creating 3D Line Drawings
https://amritkwatra.com/experiments/3d-line-drawings
该网页介绍了一种实验方法,用于创建场景的 3D 线条绘画。实验结合了 3D 高斯 splatting 技术和将照片转换为信息线条绘画的方法,通过生成具有艺术风格的 3D 线条场景,并探讨了如何添加颜色和混合真实与绘制场景的技术。
Why Semantic HTML Still Matters
https://www.jonoalderson.com/conjecture/why-semantic-html-still-matters
本文探讨了语义 HTML 在现代网页开发中的重要性,强调了语义 HTML 在提升性能、可访问性、可维护性和搜索引擎优化方面的作用。作者指出,虽然现代开发工具和框架的兴起使得开发者倾向于使用无语义的标签,但语义 HTML 仍然是构建高质量网页的基础。文章详细阐述了语义 HTML 如何帮助机器理解网页内容,提高可访问性,并减少性能问题。
A Few Things About the Anchor Element’s href
https://blog.jim-nielsen.com/2025/href-value-possibilities
本文探讨了锚元素 href
属性的各种可能值,包括常见的协议如 mailto:
、tel:
、sms:
和 javascript:
,以及一些不常见的用法,如使用 #top
、#page=
进行页面内导航,以及 data: URL
和 video.mp4#t=
等。作者通过实际测试和代码示例,详细解释了这些 href
值的解析方式和行为,帮助读者更全面地理解 href
属性的应用。
工具介绍
Spill
Spill 是一款极简主义的免费写作应用,专为无干扰写作设计。它拥有简洁的界面和强大的功能,完全免费。用户可以在一个无干扰的空间内设定时间自由倾泻想法,用于头脑风暴、剧本草稿、生活记录等。此外,Spill 还支持语音输入和语音聊天功能,方便用户在需要时进行口头表达。该应用采用开源模式,数据存储在本地,保护用户隐私。
Kimu
Kimu 是一个多功能媒体库和编辑工具,支持导入视频、图像和音频文件,提供分辨率调整、轨道编辑、调试等功能,适用于内容创作者进行多媒体编辑和项目管理。
//类似的还有 Opencut,不过后者功能上相对完善。
Blur It
Blur It 是一款专业的 Chrome 扩展程序,旨在帮助用户在屏幕共享、录制和演示过程中保护敏感信息。该工具提供多种模糊模式(文本、区域、元素),允许用户轻松选择并模糊网页上的任何部分,确保隐私安全。支持实时预览、可调节的模糊强度以及直观的界面,适用于内容创作者、教育工作者和企业用户。
Speakr
https://github.com/murtaza-nasir/speakr
Speakr 是一个个人自托管网络应用程序,用于转录音频录音。它通过在您自己的服务器上运行,确保您的敏感对话和数据保持完全私密。Speakr 可用于会议记录、治疗记录、课堂录音和 D&D 会话转录等多种用途。它自动转录音频并识别说话人,生成简洁的摘要,并提供 AI 聊天界面以与您的内容互动。最新版本(0.5.0)引入了高级标签系统、增强的 ASR 集成、Word 文档导出、基于标签的搜索和改进的用户界面等功能。
Unhype
这是一个浏览器扩展程序,旨在减少或消除网页上的标题,帮助用户更清晰地浏览网络内容。该扩展支持多种浏览器,包括 Google Chrome、Mozilla Firefox 和 Microsoft Edge,用户可以通过手动安装或从扩展商店获取。扩展程序允许用户配置内容选择器,以自定义要替换或中和的页面内容,并支持与多种大型语言模型(LLM)集成,如 Llama 3.2 3B 及以上性能的模型。
Mcp Chat
MCP Chat by Pipedream 是一个强大的聊天平台,允许用户直接与 2,800 多个 API 进行交互,从而提高生产力。该平台基于 Pipedream Connect,支持多种功能,如会议准备、客户信息查询、产品版本控制、日程总结等,是开发者实现自动化工作流的重要工具。
Bookwith
https://github.com/shutootaki/bookwith
BookWith 是一款创新的电子书阅读器,通过 AI 技术与用户实时互动,提供超越传统电子书阅读器的全新阅读体验。它能够解答用户问题、深化理解并提供新视角,是真正的阅读伴侣。BookWith 的核心功能包括 AI 阅读助手、AI 播客生成、多层记忆系统和智能标注,旨在帮助用户更深入地学习和享受阅读。
Twitter Viewer
https://www.twitter-viewer.com
Twitter Viewer 是一款无需登录即可浏览 Twitter 的在线工具,用户可以查看个人资料、推文和媒体内容。该工具提供快速、私密且免费的体验,无需创建账户即可获取推文数据、评论统计和媒体活动信息,适用于希望匿名浏览或快速查看 Twitter 内容的用户。
Megaton Mask
Megaton Mask 是一款 AI 驱动的视频遮罩工具,能够快速移除背景、提取视频中的对象,并支持绿幕、Alpha 蒙版和 PNG 序列导出。该工具采用先进的 AI 技术进行自动处理,操作简单高效,适用于内容创作、广告和影视后期等领域。此外,Megaton Mask 还提供 Magic Edge™ 细节恢复功能,进一步提升最终效果的专业度。
YouTube To Notebooklm
https://chromewebstore.google.com/detail/youtube-to-notebooklm/kobncfkmjelbefaoohoblamnbackjggk
该扩展程序允许用户将 YouTube 视频、播放列表、频道或搜索结果轻松发送到 NotebookLM 应用,以便进行 AI 驱动的摘要和笔记整理。它支持多种 YouTube 内容格式,并提供快速笔记创建、视频摘要提取和跨项目同步等功能,帮助用户高效整合视频学习资源。
资源聚合
Symbol
Symbol.so 是一个提供各种文本符号的网站,用户可以轻松复制和粘贴包括箭头、星星、心形、旗帜、检查标记、项目符号、数学符号等在内的多种符号。网站支持查看符号的 Unicode、HTML、CSS、Alt 代码等,方便用户在各种场合使用这些符号来装饰文本。
Piper1-gpl
https://github.com/OHF-Voice/piper1-gpl
这是一个快速且本地的神经文本转语音引擎,集成了 espeak-ng 用于音素化。该项目支持多种安装方式,包括 pip 安装,并提供音频样本、演示、命令行接口、Web 服务器、Python 和 C/C++ API 等功能。此外,该项目还支持训练新语音、手动构建等高级功能,被广泛应用于 Home Assistant、NVDA、自然语言处理等领域。
Sherpa-Onnx
https://github.com/k2-fsa/sherpa-onnx
该网页是一个 GitHub 仓库,项目名为 sherpa-onnx,主要提供语音识别、语音合成、说话人分割、语音增强、源分离和语音活动检测等功能。项目使用新一代 Kaldi 与 onnxruntime,无需互联网连接即可运行。支持嵌入式系统、Android、iOS、HarmonyOS、Raspberry Pi、RISC-V、x86_64 服务器、websocket 服务器/客户端,并支持 12 种编程语言。项目还支持 WebAssembly,适用于多种平台和操作系统。
随便看看
Create AI Storybooks With Illustrations In The Gemini App
https://blog.google/products/gemini/storybooks
Gemini 应用推出全新功能,用户只需简单描述故事,即可生成独特的 10 页有声绘本,支持自定义艺术和音频,并提供多种绘画风格选择,覆盖超过 45 种语言,让创意故事触手可及。
//更多使用教学可参见这篇 文章
I Made A QR Code Generator Completely With Geometry Nodes!
https://www.reddit.com/r/blender/comments/1ml4yix/i_made_a_qr_code_generator_completely_with
用户 StrikeDigital1 在 Reddit 的 Blender 社区分享了一个完全使用几何节点制作的 QR 码生成器。该项目是用户 8 年来使用 Blender 中最具挑战性的项目之一,涉及自定义列表和矩阵的实现,以及使用新发布的 4.5 版本中的位数学节点。生成器使用了约 6,698 个节点,平均长度链接的生成时间约为 1 秒。