标签 - 科技爱好者周刊

文章 feed - 评论 feed

2025-06-13

科技爱好者周刊(第 352 期):Bug 追踪系统的正确样子

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

6月6日凌晨,太原基地发射的长征六号火箭,飞过西安城墙。(via

Bug 追踪系统的正确样子

上周的话题是 GitHub Issues,把它当作笔记工具,很强悍。

但是,有些话来不及说。它的本职工作----Bug 追踪系统----并不好用

你用它来管理 Bug,就会发现有设计缺陷,用起来不顺手。

现在还活着的、历史最悠久的 Bug 追踪系统是 Bugzilla

它的一个早期工程师,前不久写了一篇文章,介绍 Bugzilla 的四条设计原则。

他说,只有满足这四点,才是一个好的 Bug 追踪系统(bug tracking system),我感到很有启发。

(1)所有任务都要列入 Bug 追踪。不仅包括代码 Bug,还包括待开发的新功能、缺失的文档、令人困惑的用户体验、糟糕的性能等等。

换言之,Bug 追踪系统本质是任务管理,应该当作项目管理系统来用。

(2)Bug 的状态有多种,不只"打开"和"关闭"两种。

大公司的 Bug 处理流程,可能很复杂,下面是一张从 Bugzilla 文档拷贝的流程图。

Bug 追踪系统应该足够灵活,可以自定义优先级、严重程度、是否已分配、是否有依赖等等,以便适配各种流程。

(3)每个 Bug 只能由一人负责。

这样才能明确责任,方便查看每个人正在做什么、接下来要做什么、以及最近做了什么。这也有利于培养开发者的归属感和成就感。

(4)支持自定义视图。

由于 Bug 有多种状态,追踪系统必须支持自定义视图查看,拥有强大的查询功能。

系统的默认视图:按照优先级,列出当前版本的所有没有关闭的 Bug。

开发者的个人视图:列出分配给他们的所有 Bug,同样按优先级排序。另外,用户可以保存自己的自定义视图。

以上四条,就是好的 Bug 追踪系统的标准。问题是 GitHub Issues 一条都没做到。

  1. 项目管理功能太弱。
  2. 状态只能靠标签。
  3. 任务可以分配给多个人。
  4. 视图默认按创建时间排序,且只能切换成标签视图。

在这方面,GitHub 甚至不如 Gitea。

举例来说,GitHub 没有办法让最重要的 Bug(P0 级别),自动出现在第一位(下图),除非手动置顶。

相比之下,Gitea(包括分叉的 Forgejo)提供了"标签集"(label set),允许一个标签有多个值,并可以按同一个标签的值排序。

上图中,标签"Priority"(优先级)有多个值,然后系统允许按照 Priority 的值排序。

[本周软件] 开源知识库 PandaWiki

小团队和个人,如何管理大量文档,搭建自己的知识库?

今天,介绍一个刚刚开源的知识库管理系统 PandaWiki

它采用维基形式,可以随意编排文档,既能搭建传统的文档站,也能做成 FAQ 和博客。

它原生支持 AI 创作、AI 问答、AI 搜索等能力。你可以用自然语言跟知识库对话,也能使用嵌入模型,找出相关文档。

大家可以去 Demo 体验一下,详细了解看官方文档

它的后端使用 Go 语言编写,速度非常快。安装使用 Docker,一行命令就能跑起来。

代码库放在 GitHub,可以从那里上手,目前已经有600多颗星星。

任正非专访

本周,《人民日报》头版刊登任正非专访

下面是一些摘录。

(1)芯片问题其实没必要担心。我们单芯片还是落后美国一代,我们用数学补物理、非摩尔补摩尔,用群计算补单芯片,在结果上也能达到实用状况。

(2)软件是卡不住脖子的,那是数学的图形符号、代码,一些尖端的算子、算法垒起来的,没有阻拦索。困难在我们的教育培养、人才梯队的建设。

(3)当我国拥有一定经济实力的时候,要重视理论特别是基础理论的研究。如果不搞基础研究,就没根。即使叶茂,欣欣向荣,风一吹就会倒的。

(4)我们要理解支持搞理论工作的。理论科学家是孤独的,我们要有战略耐心,要理解他们。他们头脑中的符号、公式、思维,世界上能与他们沟通的只有几个人。对理论科学家要尊重,因为我们不懂他的文化,社会要宽容,国家要支持。

(5)买国外的产品很贵,因为价格里面就包含他们在基础研究上的投入。中国搞不搞基础研究,也要付钱的,能不能付给自己搞基础研究的人。

(6)华为一年1800亿投入研发,大概有600亿是做基础理论研究,不考核。1200亿左右投入产品研发,投入是要考核的。没有理论就没有突破,我们就赶不上美国。

(7)人工智能也许是人类社会最后一次技术革命,当然可能还有能源的核聚变。发展人工智能要有电力保障,中国的发电、电网传输都是非常好的,通信网络是世界最发达的,东数西算的理想是可能实现的。

(8)赞声与骂声,都不要在意,而要在乎自己能不能做好。把自己做好,就没有问题。

科技动态

(1)中国科大提出"火星电池"的方案。

这种电池可以在火星上,储存太阳能的发电,在夜间释放出来。

它的原理是,电解火星大气的二氧化碳,将其转为氧气和甲烷等燃料气体,在夜间再点燃发电。

(2)华为旗下的深圳引望公司,申请了一个"可收纳方向盘"专利。

根据描述,这个专利可以将方向盘折叠起来,放入操作台里面。

(3)瑞士建造了世界最高的 3D 打印建筑:一个高达30米的观光塔,外形酷似当地的一种著名糖果。

为了增加承重能力,施工方采用了特制的混凝土材料。并且,增加了第二台机器,每打印20厘米,就往建筑物里面加入钢筋。

(4)苹果公司本周发布的新版 macOS,出现了一个细小的调整。

文件管理器 Finder 的图标左右反转了,上图左是原来的图标,右是新版图标。目前不知道,为什么要这样反转。

文章

1、过去半年的大模型回顾(英文)

Simon Willison 点评过去半年的大模型,可以当成大事记来读。

AI 的进展实在太快,去年底的模型已经是上一代了。

2、我使用 Claude Code Max 的感受(英文)

作者购买了 Claude Code 的 Max 会员,一个月要200美元,使用后认为完全物有所值。

3、速率限制交互式指南(英文)

如何限制访问速率?本文介绍了四种常用算法:令牌桶、漏水桶、固定窗口、滑动窗口。

4、Amazon VPC 图解(英文)

本文用插图解释,云服务器的虚拟私有网络(VPC,Virtual Private Cloud 的缩写)是什么。

5、五个自搭建的书签服务(英文)

本文介绍五个开源软件,可以自己架设网址书签的收藏服务。

6、我的香港露营实验(英文)

2016年,一个老外在香港留学,他的奖学金很少,就想在海边搭帐篷居住,省下房租。本文是他对这段生活的总结,挺有意思的。

工具

1、Cap.js

一个网页上的机器人识别工具,用作 CAPTCHA 方案,采用 SHA-256 工作量证明算法。

2、Quartz

Markdown 文档的静态站点发布器,适合用作收费服务 Obsidian Publish 的替代品。

3、somo

在 Linux 终端查看端口占用情况的工具。

4、OOMOL Studio

一款创新的桌面 IDE,把自己编写的函数设成节点,然后通过图形界面,把节点编排成工作流。(@BlackHole1 投稿)

5、极测

免费的通信调试助手,模拟 UDP、TCP、串口、WebSocket、ZeroMQ 等常见协议,进行通信测试。(@seasonlaw 投稿)

6、container

苹果官方发布的 Mac 电脑运行 Linux 容器的工具。也就是说,Mac 电脑可以不装 Docker,就运行 Docker 容器。

7、DarkFlare

一个命令行工具,在 CDN 上,将 TCP 流量伪装成 HTTPS 流量传输。

8、JDownloader

开源的全平台下载工具,参考这篇教程,用树莓派搭建下载服务器。

9、Pydoll

一个操作浏览器的 Python 库,通过 Chrome DevTools Protocol,实现脚本操作本机的 Chrome 浏览器。

10、Chili3D

基于浏览器的 3D CAD 软件,代码开源。

AI 相关

1、Page Magic

一个 Chrome 的 AI 插件,输入你对当前网页的修改描述,它自动将改好的网页呈现在浏览器里,需要 Anthropic API。

2、壁响(WallEcho)

根据输入的文本,免费生成手机或电脑桌布。(@twjiem 投稿)

3、AI 洞察日报

通过 Cloudflare Workers 抓取指定数据源,生成每日精选的 AI 日报,效果预览。(@justlovemaki 投稿)

4、zenfeed

智能信息助手,对于关注的新闻或话题,使用 AI 自动收集、筛选出要看的文章,并总结内容。(@glidea 投稿)

5、文颜 MCP Server

AI 模型接入这个 MCP,就可以将排版好的内容,自动发布到微信公众号,参见介绍文章。(@caol64 投稿)

资源

1、高等院校三千所

这个网站收录中国大学网址全集。(@DiamonWoo 投稿)

2、Mullvad Leta

Mullvad 公司推出的一个搜索引擎。它从谷歌和 Brave 获取搜索结果,但是提供隐私保护,防止搜索引擎识别用户。

我试用感觉不错,速度很快,没有广告。

3、DNS4EU

欧盟推出的公共 DNS,自带过滤广告功能。

图片

1、居里夫人故居的门把手

著名物理学家居里夫人,由于长期接触放射性元素,手上总是沾有镭矿石的微粒。

她在法国巴黎的故居,过了100年,至今仍能测出,门把手有微弱的放射性。

1934年,居里夫人死于过量辐射导致的再生性贫血。

2、洞穴停车场

美国密苏里州早年有石灰矿,挖出了巨大的地下空洞。

后来,矿产挖光以后,这些空洞就废弃了。

上个世纪50年代,福特汽车公司看中了这个地方。因为这里的地下空间非常大,可以容纳5000人,没有风吹雨打,没有下雪结冰,干燥,终年恒温,很适合改造成停车场,存放新车。

这个地下停车场直到今天还在运作,可能是史上最大的地下商业设施。

文摘

1、小模型

在机器学习的早期,"小模型"指的是可以在家用电脑 CPU 运行的基本神经网络。

到了2018年,如果你问别人什么是"小模型",他们可能会说,就是那种在树莓派或手机上运行的、只有几百万个参数的模型。

但是,后来出现了 Transformer 和大型语言模型(LLM)。这些模型越变越大,"小模型"的定义已经改变。

今天,任何不需要 A100 显卡集群就能运行的模型,都可以看成小模型。

我们把300亿个参数(30B)的模型也称为"小模型",因为它们只需要一个 GPU 就能运行。

今天的"小模型",更多的是指模型的可部署性,而不仅仅是模型的规模。

如果能在个人设备上部署某个模型,那么这个模型就是小模型。它可以分成下面两类。

(1)可以在移动设备或边缘硬件上运行的模型,用例为语音助手、手机翻译、离线摘要、嵌入的聊天机器人。

(2)只需一个 GPU 的模型,在这一类中,即使是 30B 或 70B 规模的模型也可以算作"小型"。

现在,一张4090显卡就能运行 70B 的模型,并有不错的输出速度,这在几年前还只是科幻小说的情节。

小模型固然比不上大模型的能力,但也有自己的优势:更适合小型的任务,在单一领域更准确,更适合微调和快速发布。

而且,小模型的成本更低,更适合个人和创业公司部署,并可以在本地部署。

这就是为什么小模型很有用,因为它让我们可以在家里运行自己的 AI 模型,得到的结果与 GPT-3.5 不相上下,从而可以用更少的资源完成更多的任务。

言论

1、

很多人总是拖拖拉拉,抱怨自己没有做事的动力。但是,动力恰恰源自行动,只要你开始做一些事情,只要能朝着目标前进,你就会发现动力随之而来。

所以,当我遇到一个很艰巨的任务时,我会把问题分解成若干更简单的部分,此时我的目标不是完成任务,而只是让自己能够行动起来,向前迈出一小步。

-- 《摆脱拖延症》

2、

最安全的代码并非优美、巧妙或优雅的代码,而是枯燥乏味的代码。

Go 语言就奉行这种理念,故意去除了那些富有表现力或优雅的写法,只保留简洁和可读的写法。这使得代码易于审查、难于滥用,不容易发生安全漏洞。

-- 《无聊胜过美丽》

3、

人们总是喜欢新东西,读书喜欢读新出版的书,听歌喜欢听新歌。

据统计,美国2024年流媒体音乐一共播放了1.4万亿次,其中近50%是2020年至2024年期间发行的歌曲,近80%是2010年或之后发行的歌曲。歌越老,听的人越少。

-- 美联社

4、

新 API 的采用速度将会大大减缓。因为大模型的学习内容仅限于已有的内容,新的 API 出现时,可供学习的内容必然很少。

另外,那些依赖大模型的人也会犹豫是否采用新 API,因为大模型使用旧 API 可以更快地完成相同的工作。

-- Hacker News 读者

往年回顾

随机数,这是一个问题(#305)

对待 AI 的正确态度(#255)

互联网风口过去了吗?(#205)

数字货币是打破美元霸权的武器吗?(#155)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年6月13日

Original post on 科技爱好者周刊

2025-06-06

科技爱好者周刊(第 351 期):GitHub Issues(几乎)是最好的笔记应用

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上海的华东电力设计院新大楼,有一个高达15层的户外螺旋楼梯,象征特斯拉线圈。(via

GitHub Issues(几乎)是最好的笔记应用

Issues 是 GitHub 的 Bug 管理工具,所有代码仓库都默认启用。

它不仅可以管理 Bug,还可以用于其他用途。

比如,我把它当作投稿论坛,大家在那里提交自己的项目。

再比如,很多人把它当作内容管理系统,用来写博客,或者存放自己的文章。

上周,著名程序员 Simon Willison(Django 框架的作者)提出GitHub Issues(几乎)是世界最好的笔记应用。

笔记软件这么多,为什么他独独看上了,根本不是用于写笔记的 GitHub Issues?

他给出了几点理由。

(1)免费,可以无限制使用。

(2)笔记可以公开,也可以私密。

(3)支持标签,可以给笔记分类,甚至还能分层(下图)。

(4)支持 Markdown 语法,有代码高亮,且可以插入各种图表(比如 Mermaid 图)。

(5)免费上传图片和视频。

(6)支持内部链接,可以将 GitHub 网址自动转成标题链接(下图)。

(7)自带评论和搜索。

(8)除了 Web 版,还提供 Windows、Mac、安卓、iOS 原生客户端。

(9)提供全面的 API,可以编程创建、编辑、导出笔记,还可以用 GitHub Actions 自动化几乎所有操作(比如发布到网站)。

它唯一缺少的功能,就是离线支持。如果没有网,就用不了。

这些理由,说服你了吗?

我觉得,他说的有道理,确实可以试试,将笔记软件换成 GitHub Issues。

[活动] 稀土掘金"夏日寻宝"

国内著名的开发者社区"稀土掘金",本月有新活动。

为了推广 AI 编程,他们与 Trae 合作,推出了主题为探索 Trae 智能编程世界的"寻宝活动"

Trae 是国内首个 AI IDE,提供一站式的 AI 编程环境,让中文用户轻松上手。

对于新用户,按照要求,完成一些简单任务,参与 Trae 深度体验,就能得到积分;对于老用户,邀请新人注册 Trae,同样也能攒积分。

积分兑换超丰富的奖品,积分越多,奖品越多,有大疆 Pocket 3、Apple watch、京东卡、机械键盘等等。

如果你想用好 AI IDE,又想薅点羊毛,那就别错过。

详情和报名入口,可以点击这个链接,或者扫描上方海报。现在就能报名,截止时间是6月30日。

科技动态

1、脑脊接口

上海中山医院尝试"脑脊接口"手术,来治疗瘫痪。

瘫痪的主要原因是,大脑和脊髓之间的连接中断,神经信号无法发给脊髓。

科研人员在大脑皮层植入电极,收集脑电波信号,然后将信号发送到脊髓神经,相当于在大脑和脊髓之间搭建了人工桥梁。

今年1月,他们成功实施了这个手术,使一名瘫痪患者在术后24小时内恢复站立和行走能力。

2、无血型的人造血液

日本科学家研制出无血型的人造血液。

血型的根本原因是,血液红细胞的表面有不同抗原。

为了消除血型,科学家从过期的捐献血液中,提取了血红蛋白,然后为这些蛋白做了一个保护壳。

这个壳不影响血红蛋白输送氧气的功能,但是消除了所有红细胞的表面抗原,因此就可以输送给不同血型的人体。

3、网友发现,Windows 11 的开始菜单是一个 React Native 应用。

尴尬的是,它有性能问题。点击开始菜单,很可能会让一个 CPU 核心飙升到30%到70%的使用率。

4、日本邮政推出数字地址,用户可以领取一个7位数字,代表本人地址,类似国内的邮政信箱。

邮寄时不用填写地址,只需输入这个数字。这样不仅省事,而且搬家也可以保持数字地址不变。

5、微软的 .NET 代码仓库,允许 GitHub Copilot 自动提交 PR,发生了一件令人啼笑皆非的事情

AI 自信地提交了有 Bug 的代码,人类程序员向它指出错误,AI 却表示没错。

人类程序员只能向它解释错在哪里,这个过程持续了好几遍。

以后,这样的事情会越来越多,人类苦苦向 AI 解释,为什么 AI 是错的。

文章

1、我的 Canonical 面试经历(英文)

Canonical 是 Ubuntu 背后的公司,作者记录了他的面试经历,从初试一直到老板的终面。

整个过程令人瞠目结舌,最重要的问题居然是高中成绩好不好。就凭这种面试,Ubuntu 就不值得看好。

2、microSD 卡可靠吗?(英文)

作者测试了200多张卡,发现 microSD 保存数据的可靠性很差。数据读写循环3000次后,大部分卡都会遇到故障或读写错误。

作者评价了10多个常见品牌,可以作为购买参考。

3、Go 不再修改错误处理的语法(英文)

Go 语言的错误处理,与众不同,报错会单独返回一个值,这导致代码冗余。

多年来,使用者一直要求有更好的写法,Go 团队想了很多办法,效果都不好。现在,官方终于宣布,不再寻求更好的写法,保持现状。

4、NLWeb 协议简介(英文)

NLWeb 是微软新提出的一个接口协议,类似于 MCP 协议,是网站跟 AI 大模型的对话协议,方便大模型从网站获取数据。本文是这个协议的简介。

5、运行本地 AI 的教程(英文)

这篇短文介绍,如何使用 Python 工具 llm,快速在本地计算机上运行 AI 模型。

工具

1、Quarkdown

一个使用 Markdown 语法的排版系统。

2、RsyncUI

一个开源的 Mac 应用,提供 rsync 的图形界面,用于跟远程服务器传输文件。

3、Donut

一个浏览器的编排器,可以保存各种不同的浏览器配置,根据需要快速启动。

4、Read Frog(陪读蛙)

一个浏览器插件,可以翻译页面,提取文章主要内容,给出单词和句子和详细解释,代码开源。(@mengxi-ream 投稿)

5、词小悟

主打图片识记单词的微信小程序。(@fluidog 投稿)

6、Datetime.app

开源的日期时间网站,time.is 的替代品。(@airyland 投稿)

7、naviix

网页的键盘导航库,通过上下左右的方向键,选取网页的焦点元素。(@wswmsword 投稿)

8、go-v2ex

基于 Go 语言的命令行版 V2EX 客户端。(@seth-shi 投稿)

9、TL-RTC-APP

开源的 Web 即时通信系统,基于 webrtc。(@iamtsm 投稿)

AI 相关

1、Google AI Edge Gallery

谷歌新发布的安卓 App,允许用户在手机运行 Hugging Face 上面的开源 AI 模型,即它可以让手机运行本地 AI 模型。

2、Bing Video Creator

微软旗下的 Bing 搜索引擎,加入了视频生成功能,可以使用自然语言生成免费视频,使用的是 OpenAI 的文生视频模型 Sora。

该功能目前只在 Bing 的手机 App 上开放。

3、AIDocGenius(智能文档助手)

一个 Python 脚本,集成了 AI 文档摘要、翻译、分析和格式转换。(@jiangmuran 投稿)

4、Low Fade AI

免费、免注册的换发型、发色的 AI 工具。(@twjiem 投稿)

5、Read Bridge

AI 驱动的 epub 阅读助手,通过 AI 分析书里的句子,在线试用。(@WindChimeEcho 投稿)

6、TEN VAD

一个轻量级 AI 模型,检测音频帧中是否存在人声。(@bluemotional 投稿)

资源

1、中国盲人数字图书馆

中国国家图书馆制作的盲人书库,全站使用无障碍技术,有页面工具条,所有内容可以有声播放。

2、大学生创新创业项目资源库

免费的文档资料库,包含互联网+、挑战杯、国创赛、SYB、三创等主流双创赛事。(@urongda 投稿)

3、通辽宇宙知识库

专为 B 站 UP 主"小约翰可汗"粉丝打造的互动式历史探索平台。(@Acorn2 投稿)

4、​​Reddit Top​

Reddit 热门帖子聚合网站,可以指定多个频道。(@zhangchenchen 投稿)

5、美国地址生成器

这个工具网站生成美国虚构的身份数据,包括地址、个人信息、就业状况、信用卡。(@watianle 投稿)

图片

1、班克斯的新作品

班克斯(Banksy)是欧美著名的街头画家,经常会在意想不到的地方,留下作品。

5月29日,他的最新作品出现在法国马赛市的一面墙上。

他在墙上画了金属安全柱的倒影,那是一座亮灯的灯塔。

下面写着一行字:"我想成为你所看到的我"。

意思是,虽然我只是一根不起眼的柱子,但也想成为你眼中的灯塔。

2、ChatGPT 的散文能力

一位美国用户让 ChatGPT 用文学语言,描述纽约的生活。

它这么回答。

纽约是唯一一个让你感觉神奇触手可及的地方。这里的混乱会磨砺你的雄心,每个街角都是一面镜子,让你想入非非,自己会成为谁?

你热爱纽约,因为它让你的欲望变得具体。在这里陌生与亲密共存;在这里,你可以完全的孤独,却依然跟10亿个脉搏相连。它匹配你的速度。在这里,人们选择优雅地承受痛苦:他们愿意支付高昂的租金,租住在五楼的无电梯公寓,只为了靠近城市的活力,靠近那里的野心、艺术、金钱和疯狂。

这段话的文学性令人刮目相看,AI 居然能写出这样的散文,堪比散文家。

文摘

1、太阳死亡时

大约45亿年后,太阳将进入其生命的最后阶段。

太阳内部的氢聚变核心将不断膨胀,最终成为一颗红巨星。膨胀的太阳会吞噬水星和金星,并将地球烧为灰烬。

在最好的情况下,地球将只剩下一堆冒烟的铁和镍。在最坏的情况下,它将彻底不存在。

随着太阳的热量急剧释放,太阳系的宜居带(行星表面存在液态水)将稳步向外扩展。

到了那时,木星的卫星木卫二将吸收大量热量。一方面是因为太阳的辐射,另一方面木星本身也会变得更热,反射更多阳光,从而为木卫二提供热量。

现在的木卫二是一颗冰冷的星球,被冰盖覆盖。那时,木卫二的冰壳将升华,冰壳下方的海洋将蒸发。

(图片说明:美国宇航局的木卫二探测器飞越木卫二冰壳的想象图。该探测器于2024年10月14日发射,预计将于2030年4月抵达木卫二。)

木卫二面向木星的一侧,由于吸收的热量最多,升温最厉害。此外,它的赤道带也将遭受严重的水分流失。

然而,木卫二背对木星一面的南北极,温度并不高,水分流失更温和。研究人员推测,那里或许能形成一层稀薄的水蒸气大气层。

在遥远的未来,木卫二也许会成为太阳系中任何剩余生命的家园。

言论

1、

有一种新的编码方式,我称之为"炒作编码"(hype coding),就是按照媒体炒作的方式,使用 AI 编程。

一边刷着抖音,一边让一大群 AI 为你编码。如果出错,就让 AI 再试一次,也不阅读它的输出,只把这些输出重新提交给 AI,直到运行成功。如果最后无法运行,那就等待下一个模型发布。

-- 《炒作编码》

2、

在机器大量生产平庸之作的这个时代,自己动手做点什么吧。让它不完美。让它粗糙。就这么去做。

-- 《这个时代,没人在乎你写了什么》

3、

一项研究称,养成一种新的生活习惯,平均需要66天,最长需要8个月。

-- 《欧洲社会心理学杂志》

4、

习惯使用 AI 大模型的下一代人,将不知道图书馆的用途。

-- Benjamin Breen

5、

我们生命中最美好的时刻,并非是那些接受给予、放松享受的时刻,而是那些为了完成一件困难而有价值的事情,自愿将身心发挥到极限的时刻。

---- 米哈里·契克森米哈赖,"心流"(flow)概念的提出者

往年回顾

最受欢迎的颜色(#304)

人生是一个长板问题(#254)

如何度过疫情、裁员、还有战争(#204)

1982年的信息社会预言(#154)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年6月 6日

Original post on 科技爱好者周刊

2025-05-30

科技爱好者周刊(第 350 期):Java 三十周年

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

正在举行的第26届舟山国际沙雕节,主题是"海上音乐城"。海滩上50多座沙雕,组成了一把吉他。(via

Java 三十周年

上周是 Java 语言诞生三十周年。1995年5月23日,Sun 公司正式发布了这种语言。

三十年了,大家觉得 Java 算不算老语言?

说实话,我一直以为,Java 跟 C++ 是同一时期的语言。但是实际上,Java 与 Python、JavaScript、PHP 同时期,属于年富力强的年轻语言。

全世界的计算机语言有几千种,Java 是特别、特别成功的那一类。从发布的第一天起,它就很成功,一直保持到今天。

Java 的成功体现在两方面。

(1)它无所不在。日常生活中,我们接触到的软件服务,尤其是企业级服务,后端的开发语言大部分都是 Java。

Java 在服务端是霸主地位,在桌面端也有广泛应用,很多人用它写桌面软件。至于手机端,就更不用说了,安卓系统就基于 Java。

(2)它的工作岗位最多

如果你问我,学习什么编程语言,最容易找工作?

没有其他前提的情况下,我会建议学习 Java,它的工作岗位最多,最容易找。

Python 语言虽然也很热门,但是工作岗位往往要求高级程序员,中级和低级的岗位并不多。不像 Java,你只要具有一般水平,就可以去应聘,需要普通 Java 程序员的地方非常多。

国外有一条经验法则,叫做林迪效应(Lindy effect),说的是一种事物的预期寿命与它已经存在的时间成正比。它已经存在多久,你可以预期,它还会存在这么久。

那么,Java 已经流行了30年,接下来30年,很可能还会继续流行。

高斯林口述历史

Java 语言的发明人是高斯林(James Gosling,1955-)。他在 Sun 公司时,发明了 Java。

2019年,美国的计算机历史博物馆采访他,一连两天,每天三个小时,后来制作了一个节目《高斯林口述历史》(Oral History of James Gosling)。

网上有视频 + 文字稿(PDF ),他谈了很多东西。下面,我摘录跟 Java 有关的部分,非常有意思。

问:你什么时候开始研究字节码?

答:我在卡内基梅隆大学读研究生时,开始从事字节码方面的工作。

当时,我的导师要求我,将一些软件从一种计算机移植到另一种计算机。我不知道他怎么想的,移植软件非常困难。

但是我发现,写一个字节码到汇编代码的编译器却很容易,得到的代码质量比原生的 C 编译器还要好,能够顺利运行。

这件事让我记住了,只要生成软件的字节码,然后为不同平台写一个字节码到汇编语言的编译器,就能让软件在不同架构的计算机上运行。

问:你怎么在 Sun 公司开始搞 Java?

答:Sun 公司的产品是服务器,在消费电子领域错过了很多机会。

我们当时有一群人,核心小组大概只有四个人,想探索消费电子领域。首席执行官同意了,给了我们一笔钱,那时是1991年。

我们决定做一个原型设备,项目名叫 Star7。这个设备相当古怪,有点像后来的 iPad。事实上,我们团队后来有几个人,确实继续从事 iPad 的研发。

我们并不想做那种特定功能的设备,而是想要一个网络设备,可以跟其他设备相互通信,并进行远程控制。

我们设想的一个用途是,当时的电视和录像机都有各自的遥控器,我们想用一个设备同时遥控多种其他设备,不仅能够控制电视,还能控制灯光,并且可以互动。

当然,Star7 没有成功。但是过了30年,人们竟然还在打造这样的设备,感觉有点奇怪。

问:你怎么想到要为这个设备,发明一种新的编程语言?

答:我们最初的目标不是发明一种编程语言,但是我们意识到,很多问题都源于编程工具。

我们想改进一下 C 和 C++,让它们更适合我们的环境。我自愿承担了这项任务,因为我是小组里唯一一个之前开发过编译器的人。

随着时间的推移,我改动的部分越来越不像 C++ 了,开始像一种独立的语言。

问:这种语言最初命名为 Oak?

答:是的,它最初被命名为 Oak(橡树)。这纯粹是偷懒,我当时需要新建一个文件夹,存放代码。我坐在办公桌前,望着窗外,看到一棵橡树,就为文件夹起了这个名字。

问:一开始,该语言就被设计为独立于特定平台?

答:是的。平台独立性是我们从一开始就考虑的事情之一。

这其实来自那些消费电子公司,他们是这种语言的使用者。他们非常不乐意受制于特定供应商,如果某个供应商有问题,他们希望可以更换供应商。CPU 也是如此,他们不希望受制于特定的 CPU。

问题就来了:如何才能让他们轻松地从一种芯片切换到另一种呢?这不就是我在卡内基梅隆大学移植字节码时遇到的问题吗。

所以,新语言的核心特性就是字节码,这样才能轻松地针对不同的 CPU 指令集进行开发。

如果厂商要为某个芯片制造一些东西,比如下一代录像机或电视机,即使处理器架构发生变化,也不用重写大量代码。现有的代码可以有把握地在尚未发明的机器上运行。

问:Java 的口号"一次编写,随处运行"(Write once, run anywhere)是这样来的吗?

答:我完全不知道这句话是谁想出来的,它是公司的营销用语。这句话说得很棒,但把事情过分简化了。

问:Java 是什么时候从机顶盒转向互联网?

答:应该是94年或95年,我们决定放弃机顶盒。因为我们发现,大型媒体公司内心深处,并不想要一款强大的新设备,而是想要控制用户的眼球,多吸引广告商。

我们决定转向更广阔的领域,让新语言可以用在互联网开发。

问:Java 是怎么赢得软件开发商的?

答:我们发现,Java 与平台隔离的特性很有吸引力,它不关心你使用哪种浏览器,因此你可以把平台问题与应用程序的问题隔离开来。

我们不再以消费者和嵌入式为中心了,而是思考这种语言怎么帮助更广大的软件开发者。

如果你是一个软件开发者,你不必考虑在谁的平台上开发软件,Sun、微软的 Windows NT 或者惠普。如果你用 Java 开发,你可以把软件卖给使用不同平台的客户。

问:你们发现 Oak 被另一家公司占用后,才想到了 Java 这个名字?

答:是的。你要发布一款产品,必须给它起个名字。Oak 已经被其他公司注册成商标了,我们被迫选择一个新名字。

那时,我们已经准备好发布软件了,就是缺一个名字。我们组织了一场命名会议,询问大家的意见,列出一张大家感觉可以的单词列表,然后发给律师,让他们从上到下检查有没有商标问题,哪个单词第一个通过检查,我们就用那个。

问:Java 是第四个单词?

答:是的。我个人最喜欢的是排名第三的 Lyric,但它没通过检查。排名第一的单词,也就是项目组大多数人最喜欢的名字,是 Silk。我不喜欢这个词,觉得它有点吓人,让我想起了蜘蛛。尽管喜欢它的人说,它象征互联网。我忘了排名第二是什么词,但是第四是 Java,我们就用了它。

科技动态

(1)内蒙古一煤矿,实现了100台无人卡车的编组运行,操作人员仅仅6人。

注意,无人卡车的驾驶舱位置是电池。

(2)戴森公司创始人,发布世界最薄吸尘器,机身仅高95毫米。

(3)杭州举行人形机器人格斗赛

比赛机器人采用遥控操作。

(4)丹麦继日本之后,成为全世界第二个国家,将退休年龄提高到70岁。

(5)阿联酋成为全球首个国家,为全体公民和居民免费提供 ChatGPT Plus,该服务目前的月费为20美元。

文章

1、CAPTCHA 没用了(英文)

作者在一家票务网站工作。他提出,各种识别机器人的验证机制,要么可以被 AI 绕过,要么不适用于出票,难以找到有效的解决方案。

2、我的同步备份方案(英文)

作者的备份方案分成两部分。(1)使用开源软件 Syncthing 在多台电脑之间同步目录,(2)使用 TrueNAS 将本地内容同步到云存储。

3、Bash 脚本执行心跳测试的写法(英文)

本文教你一种简单的写法,使用 Bash 脚本执行心跳测试(验证服务器是否正常在线)。

4、虚拟主机加固指南(英文)

开通虚拟主机(VPS)后,应该如何设置,提高安全性,本文给出基本步骤。

5、自解释的代码(英文)

本文通过一个例子,演示应该怎么写,才能让代码清晰易懂,自己解释自己。

工具

1、Defuddle

一个 JS 库,从 HTML 网页代码提取内容,转成文本。

2、DockFlare

Cloudflare Tunnel 的开源管理工具。

如果内网有多个 Docker 容器,通过 Cloudflare Tunnel 向外网开放,DockFlare 可以对它们进行统一管理,参见介绍文章

3、f2

一个命令行的文件批量改名工具,功能较强,参见介绍文章

4、TypeID

唯一身份识别码 UUIDv7 的改进版,加上了类型前缀。

5、Starlight

基于 Astro 框架的文档网站生成工具。

6、ntfy.sh

消息推送工具,向手机和桌面电脑推送消息,可以自搭建,也可以使用官方服务器,参见介绍文章

7、BillionMail

开源的电子邮件营销平台,帮助企业和个人管理电子邮件营销活动,可以发送新闻通讯、促销邮件、消息。(@aaPanel 投稿)

8、Lynx Proxy

开源服务器,代理 HTTP/HTTPS 和 WebSocket 流量,内置 Web 管理界面。(@suxin2017 投稿)

9、Text to SVG

字体转 SVG 的工具网站,可以用来制作文字 Logo。(@JiuRanYa 投稿)

10、DualPiP

Chrome 插件,提供增强版的画中画播放器,支持主流视频网站一键弹出。(@ymlluo 投稿)

AI 相关

1、Smart Mermaid

将文本转为 Mermaid 格式的可视化图表,省去手动编写 Mermaid 代码。(@liujuntao123 投稿)

2、Folda-Scan

一个与代码库对话的 Web 应用,可以扫描本地文件夹,对其建立本地索引,从而用自然语言库对话。(@oldjs 投稿)

3、Ainee

AI 开源笔记工具,将音频、文字、文件以及 YouTube 视频等转换为笔记。(@luyu0279 投稿)

4、OpenDerisk

开源的 AI 运维助手,对线上系统提供 AI管家,与真人协同处理运维问题。(@csunny 投稿)

资源

1、周刊 AI 总结器

AI 提炼的每一期周刊重点内容,代码开源。(@ronething 投稿)

2、日本語文章解析器

日语句子分析的网站。(@cokice 投稿)

Computex 的奇特 PC

上周闭幕的台北 Computex 2025 电脑展,出现了很多奇特的 PC(来源12)。

1、招财进宝

你以为这是金元宝吗?错了它是一台电脑。

它的背后就是机箱,金元宝上方的流水装置就是循环的液冷。

2、变形金刚

这个变形金刚也是一台电脑,头部会旋转,眼睛会变色,还能播放语音。

它胸部发亮的地方,就是电源按钮。

腿部就是放置显卡的地方。

3、水族馆

这个水族馆是真正的海景房电脑,里面有水母和金鱼的饰品。

风扇的 RGB 灯效,做得像灯笼一样,晚上亮起来肯定很漂亮。

4、黄貂鱼

这台电脑模仿了黄貂鱼,但是又好像一架飞机。

它的两侧前翼,可以用胸前的齿轮,调节移动。

5、咖啡机

这个咖啡机机箱是概念产品,应该不能用来冲咖啡。

6、跑车

这台跑车机箱,显卡插在车尾,引擎盖下面是主板和散热风扇。

7、黑神话悟空

黑神话主题机箱,外面包了一层"牛王铠甲"。

8、河马

河马机箱走可爱路线,下面的水盆好像是标配。

9、茅草屋

茅草屋机箱无敌了,上面真的覆盖了一层稻草,放在家里可以做盆景了。

言论

1、

我从来不喜欢内容收费,我的所有写作和研究成果都免费发布,这带给我巨大的价值。

现在,我想尝试一种不一样的订阅:你付钱给我,我会少给你发送一些东西。

我会推出一份仅限赞助者的月度邮件,里面都是我精心选择的重点内容,你就不用每天看我的大量更新了。

-- Simon Willison,著名开发者

2、

AI 是比真人更好的老师,但是以后的学校还会需要真人老师,他们的主要职责是看管孩子。

-- 路易斯·冯·安 (Luis von Ahn) ,Duolingo 的首席执行官

3、

把 AI 当作工具,而不是拐杖,那些2019年时被认为有价值的基础工程技能,值得你继续投资。

-- 《不要让 AI 加速我们的无能》

4、

最有害的建议之一就是不要重新发明轮子。

这种建议会导致一种抑制好奇心和探索的氛围。现代生活的很多重要发明,都来自那些不听从这个建议的人们。

重新发明轮子就是一种学习,并且学习过程中,你可能会做出更好的版本。

-- 《重新发明轮子》

往年回顾

技术封建主义(#303)

训练材料用完之日(#253)

英国的名校签证,伯克利的计算机教育(#203)

机器翻译是对译者的侮辱吗?(#153)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月30日

Original post on 科技爱好者周刊

2025-05-23

科技爱好者周刊(第 349 期):神经网络算法的发明者

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

北京的护城河公共绿道,位于鼓楼附近。(via visuals_china@instagram

神经网络算法的发明者

上周的《李飞飞自传》读后感,还有后续。

那篇文章的结尾是,2012年一支加拿大团队使用神经网络算法,夺得了 ImageNet 比赛冠军。

今天就来说说,这支加拿大团队的故事。

大家看了就知道了,神经网络算法是怎么诞生的,背后的推手又是谁。

(1)杰弗里·辛顿(Geoffrey Hinton,1947-)

辛顿出生于英国,后移居加拿大。他是神经网络算法的奠基人和主要发明者。

神经网络的概念,是上世纪40年代后期提出的(提出人不是辛顿)。当时的想法是,既然人类通过神经网络进行思考,那么只要让机器模拟神经网络,机器就能思考了。

但是,那只是一个概念,并没有具体的算法。机器怎么模拟思考,人们并不知道。

1984年,辛顿在加州大学担任博士后,与两个同事一起提出了反向传播算法。

这个算法可以建立多层网络,产生一个输出结果,让神经网络变成了现实,也是后来更高级算法的基础。

由于它需要多层计算,后一层在前一层的结果上学习,所以被称为"深度学习",辛顿因此成为"深度学习之父"。

辛顿后来因为这个贡献,获得了图灵奖(2018年)和诺贝尔物理学奖(2024年)。

(2)杨立昆(1960-)

杨·安德烈·勒坎(Yann André Le Cun,中文名杨立昆)是法国人。上个世纪80年代,他是多伦多大学博士后。

这一时期,辛顿也来到了多伦多大学任教,担任他的指导教师。

所以,杨立昆是辛顿的大弟子,继承和发展了辛顿的算法。他的主要成就是,为神经网络引入了卷积算法,并且做出了第一个有实际用途的神经网络。

1990年代,他用神经网络识别银行支票的手写数字,成功获得了企业的采用。

但是,这个应用也暴露了卷积神经网络的弱点:它需要大量样本的训练,耗费巨大的算力。银行支票只需要识别10个阿拉伯数字,如果是更多样化的场景,当时的计算能力难以做到。

学术界因此认为,卷积神经网络只适用特定的、计算量较小的场景,不具备推广的价值。这导致这种算法,以及辛顿和杨立昆,被冷落了二十年。

这二十年,杨立昆一直混迹于企业实验室和大学教研室。等到世界重新认识卷积神经网络,他在2018年与辛顿一起获得了图灵奖,现在是 Meta 公司的副总裁和 AI 首席科学家。

(3)亚历克斯·克里泽夫斯基(Alex Krizhevsky,1986-)

亚历克斯·克里泽夫斯基是乌克兰人,少年时随家人移民到加拿大。2007年,他进入多伦多大学,成为辛顿的博士生。

这时距离杨立昆提出卷积神经网络,已经过去快20年了。辛顿始终没忘记它,他鼓励亚历克斯和稍后要提到的伊尔亚·苏茨克维,使用这种算法,去挑战李飞飞的 ImageNet。

亚历克斯就写了一个程序,用 ImageNet 的1500万图片,来训练他的卷积神经网络。但是,计算量太大了,他的个人计算机根本跑不动,他就买了两块 Nvidia 显卡,每天24小时一刻不停地运算。

事实证明,卷积神经网络+大训练集+高速计算硬件,超过了其他一切已知的算法。最终,他们的三人团队以巨大优势,夺得了2012年第三届 ImageNet 算法比赛冠军。

这件事轰动了业界,各大互联网公司纷纷邀请辛顿和他的学生加入。百度也伸出橄榄枝,邀请辛顿担任首席科学家,但是最后输给了谷歌。

2013年,谷歌以4400万美元收购了辛顿成立的空壳公司,将辛顿、亚历克斯、伊尔亚三个人一起招入麾下。

2017年,亚历克斯辞职,现在一家创业公司研究 AI 技术。

(4)伊尔亚·苏茨克维(Ilya Sutskever, 1986-)

伊尔亚·苏茨克维出生于前苏联,后去了以色列,然后来到加拿大。他是亚历克斯·克里泽夫斯基在多伦多大学的博士同学,也是辛顿的博士生。

他与亚历克斯组成团队,共同赢得了2012年的 ImageNet 算法比赛。辛顿作为指导老师,也是团队一员。

他在2013年跟随辛顿加入谷歌,2015年辞职,成为 OpenAI 的联合创始人和首席科学家,后来是 ChatGPT 的主要作者之一。2024年,他离开 OpenAI,现在创立了自己的 AI 公司。

(5)安德烈·卡帕斯(Andrej Karpathy,1986-)

安德烈·卡帕斯出生于斯洛伐克,15岁随家人来到加拿大,在多伦多大学读完了本科。

他跟伊尔亚·苏茨克维很可能大学里就认识。但是,他没在多伦多大学读博士,而是去了斯坦福大学,指导老师就是李飞飞。

他的方向也是卷积神经网络,博士期间开设了斯坦福大学第一门深度学习课程,担任主讲。

2015年,他跟随伊尔亚一起加入 OpenAI,成为主要研究人员。

2017年,他离开 OpenAI,去了特斯拉,担任特斯拉 AI 总监,2022年离职。

(6) 总结

上面五人是神经网络算法的主要创立者和推动者。没有他们,就不会有今天的 AI 大模型。

但是,单单靠他们的算法,AI 不会成功。因为算法需要大量的数据进行训练,而训练需要高速计算的硬件。这三者缺一不可。

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

历史于是翻开了新的一页,AI 时代正式来临。

科技动态

(1)一家深圳公司推出了,可能最炫酷的树莓派机箱

它自带机箱显示屏、RGB 灯光、风扇、NVMe SSD 扩展板,很适合用作 NAS 和 AI 边缘计算。

(2)芬兰尝试在驯鹿的鹿角,涂上荧光粉。

这是为了方便司机在夜间看到驯鹿,目前每年在芬兰公路上被撞死的驯鹿有4000头。

(3)在线会议软件 Google Meet,推出实时语音翻译,首先提供西班牙语版本。

在线会议时,对方说西班牙语,你听到的却是英语,而且声音、语调和情感‌都不变。

(4)意大利开源硬件公司 Arduino,研发出了可降解 PCB(电路板),减轻对环境的污染。

这种可降解电路板,将电路印刷在植物亚麻材料上,而不是传统的玻璃纤维和树脂。

不过,电路板上的铜无法降解,需要在丢弃电路板之前先回收。

(5)一家美国创业公司,准备发射卫星,将 AI 机房建在太空

它依靠24小时的太阳能供电,也不用担心散热。

该公司希望通过这种方法,解决 AI 服务器的耗电和冷却问题。

文章

1、手机的 Linux 桌面环境(英文)

作者出门不带笔记本,只带手机,再配上蓝牙键盘和 AR 眼镜。

他的安卓手机在获取 root 权限后,通过 chroot 安装了 Linux 发行版,从而可以运行桌面环境。

2、AI 应用的核心逻辑(英文)

作者提出,AI 应用(AI agent)的核心逻辑只需要9行代码。

3、浏览器默认屏蔽的端口(英文)

你可能不知道,浏览器无法打开下面的网址localhost:6000,原因是6000是浏览器默认屏蔽的端口。

4、推荐 RustDesk 远程桌面(英文)

Mac 电脑访问 Windows 电脑,一种方法就是使用远程桌面,作者推荐远程桌面工具 RustDesk。

5、HTML <dialog> 的 CSS 技巧(英文)

HTML 有一个原生的弹窗元素<dialog>,本文介绍两个配套使用的 CSS 技巧。

6、Git 配置详解(英文)

本文详细解释 Git 配置命令 git config 的几个最常见的设置。

工具

1、Pyrefly

Meta 公司发布的 Python 代码的类型检查器,参见介绍文章

2、Zen Browser

新发布的一个开源浏览器,基于 Firefox,国外评价非常高,使用体验好,参见介绍文章

3、xtool

Xcode 的替代品,在 Linux/Win/macOS 开发 iOS 应用。

4、Zero Convert

在线批量转换文件,基于 WebAssembly 技术,完全本地完成,还可以编辑图片。(@xiaoshangmin 投稿)

5、耗子面板

Go 语言开发的服务器管理面板。(@devhaozi 投稿)

6、Goravel

Go 语言的 Web 开发框架,与 PHP 的 Laravel 框架保持一致,方便快速上手。(@devhaozi 投稿)

7、OpenSpeedy

开源的游戏变速工具,通过调整 Windows 系统时间函数来实现游戏速度变化。(@game1024 投稿)

8、SimonAKing-Gallery

后端的 JS 相册应用,瀑布流展示图片,指定图片目录,直接运行即可。(@SimonAKing 投稿)

9、Jwno

网友开源的 Windows 10/11 平铺窗口管理器,键盘驱动。(@agent-kilo 投稿)

10、星河小程序

滴滴公司开源的跨平台开发框架,支持将小程序打包成为安卓、iOS、鸿蒙和 Web 四个平台的原生 App。(@dos1in 投稿)

AI 相关

1、aTrain

一个跨平台、图形界面的自动语音识别工具,基于 Whisper 模型,支持识别50多种语言,参见介绍文章

2、AI Image Editor

在线的免费图像处理工具,提供多种 AI 功能,比如图片增强、去除水印、风格转换等十几种。(@worminone 投稿)

资源

1、万物博物馆

一个跨平台的桌面软件,将维基百科变成一个虚拟博物馆。

每件展品与维基百科的一篇文章相对应,墙上的画框就是文章图片,讲解牌就是文章内容。

走廊则根据文章的链接通向其他展厅,有几乎无限的展厅可以参观。

图片

1、《星球大战》的机器人

《星球大战》的第一部电影,拍摄于1976年,里面有一个机器人 R2-D2,会四处走动,做各种动作,还会说话。

其实,它根本没那么高科技,拍摄的时候,就是里面藏了一个真人演员。

2、冰为什么体积大?

水变成冰以后,体积会增大10%,密度因此小于水,使得冰可以浮在水面上。

那么,冰的体积为什么会增大呢?

答案是冰的分子结构,跟水的分子结构不一样。

上图左侧是液态水的分子结构,右侧是冰的分子结构。其中,白色节点为氢原子,红色节点为氧原子。

可以看到,液态水是紧密聚合的网络结构,冰则是中空的网络结构。也就是说,冰的分子结构不是那么密合,所以体积就变大了。

文摘

1、Slack 公司的 URL

Slack 是一家即时通信的软件公司。它的官网有一个"公司介绍"的页面,通常来说该页面的 URL 会是slack.com/about,但是 Slack 没有采用这种做法。

它将这个页面命名为is,并分拆成若干个子页面。

所以,"公司介绍"页面的 URL 是slack.com/is

子页面的 URL 如下。

  • slack.com/is/team-communication
  • slack.com/is/everything-in-one-place
  • slack.com/is/wherever-you-are

这样的好处是单单看 URL,就知道页面想要传递的信息,URL 本身就是对公司的一种宣传。

这种 is 的巧妙做法,后来被广泛借鉴。碰巧的是,is也正好是一个顶级域名,代表冰岛(iceland)。很多名人就申请了 is 域名,作为个人主页。

比如,艺术家杰西卡·希斯切(Jessica Hische)的个人网站,域名就是jessicahische.is,她介绍自己的页面 URL 就都是jessicahische.is/xxx的形式。

言论

1、

我们很快会跟大家分享一个低调的研究成果。我们会给它起一个比 chatGPT 更好的名字,以防它流行起来。

-- Sam Altman,OpenAI 的 CEO

2、

加尔定律经常被引用:"一个有效的复杂系统,总是从一个有效的简单系统进化而来。"

但是,它的推论很少被引用:"一个从零开始设计的复杂系统永远不会有效,你必须从一个可以运行的简单系统开始。"

-- Stack Staves

3、

宇宙有两种可能:要么我们是孤独的,要么我们并不孤独。这两种可能性都同样令人恐惧。

-- 阿瑟·克拉克,英国著名科幻小说家

4、

太阳绕银河系公转一圈需要2.3亿年,上一圈的时候,地球的主宰还是恐龙。

-- Reddit 网友

5、

我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

最终可能会出现这样一代人,自己的智力很低下,完全依赖于他们不理解的技术,一旦技术崩溃,他们永远无法从头开始重建。

-- 尼尔·斯蒂芬森(Neal Stephenson),美国科幻小说家,"元宇宙"一词的创造者

往年回顾

创业虽然好,不敢推荐了(#302)

互联网创业变难了(#252)

三个有启发的学习方法(#202)

从北大到技校(#152)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月23日

Original post on 科技爱好者周刊

2025-05-16

科技爱好者周刊(第 348 期):李飞飞,从移民到 AI 明星

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

5月1日,宇宙飞船造型的深圳科技馆新馆开馆,上图是设计团队在新馆前合影。(via

李飞飞,从移民到 AI 明星

大家知道李飞飞吧,AI 的明星教授。

她在斯坦福大学任教,是美国国家工程院等三院院士,担任过斯坦福 AI 实验室主任,以及谷歌云 AI 首席科学家。

她1976年出生于北京,在成都长大,16岁全家移民美国。

我一直好奇,她怎么走上 AI 这条路,从移民变成学术明星?

这几天,我读完她的自传《我看见的世界》(中信出版集团,2024),才发现她的人生很有戏剧性,每当重要关头,都有幸运的事情发生

(1)高中阶段

她出生于一个普通家庭,中学阶段并无过人之处。

我们家位于成都当时的外环路旁边,小区由三栋一模一样的塔楼组成,我家住在四楼。这个环路是不断扩张的城市边缘,一侧是工厂,另一侧是农田。

我进入了一所吸引全市优秀学生的中学。在那几年里,对女孩的预设和偏见让我越来越不耐烦,这种情绪已经超出了课业的范围。在同龄人中,我已经有"假小子"的称号。

1992年,移民美国后,她家的生活顿时变得困难。一家三口挤在新泽西乡下一间一居室公寓,她睡客厅,床就放在餐桌旁边。

父亲在一家华人商店修理旧相机,后来被辞退,从此失业。母亲做杂货店营业员,后因风湿性心脏病,回家休养。李飞飞下课后,就要去打工,有时在中餐馆端盘子12个小时,每小时2美元。

最后,实在走投无路,她们家决定买下社区的一家干洗店,靠洗衣为生。买下干洗店需要10万美元,全家仅有2万美元储蓄,其余8万美元都是借的。

(2)大学阶段

1997年,李飞飞中学毕业,要申请大学了。

一开始,我的目标大学主要是州立大学和社区大学,而不是常春藤学校。但我一直对一所顶级高校念念不忘,那就是普林斯顿大学。

我们是一个靠从车库市场淘来的旧货才能勉强度日的家庭,连我用的计算器都是坏的,我们怎么可能负担得起常春藤学校的学费呢?

尽管如此,我还是无法抑制内心的冲动,提交了申请。就算只是象征性地申请一下,我也感觉具有特殊意义。

她申请了普林斯顿大学,结果好梦成真,普林斯顿给了全额奖学金。

如果没有全奖,以她家的经济状况,负担不了学费。如果不去普林斯顿大学,她就不太可能走上学术道路了,更不要说后面的成就了。

(3)博士阶段

大学毕业后,李飞飞原想去华尔街工作,解决家庭的经济问题。

母亲鼓励她,继续追求自己的梦想。于是,她选择去加州理工学院读研究生,方向是视觉识别机制。

2004年,李飞飞为了写博士论文,需要图片材料,来训练算法。她找了9000张图片,组成了一个图片集,手工对每张图片进行分类标注,一共分成101类。

这个图片集叫做 Caltech 101,算法经过训练,就能从新图片识别出这101类物品。她因此顺利拿到了博士学位。

(4)助教阶段

博士毕业后,李飞飞先去伊利诺伊大学,后去普林斯顿大学,都是担任计算机科学的助教。

她继续探索视觉识别,想找到一种通用算法,能够识别所有种类的物品,而不是 Caltech 101 那样,只能识别出101类物品。

这意味着她需要一个超大的图片训练集,能够包含了世界上所有物品。这可太难了,所有人都反对这件事。

我们都是年轻的助理教授,所处的院系竞争激烈,在事业起步的那几年里,我们都面临着"要么发表论文,要么完蛋走人"的局面。压力之下,我们必须马不停蹄、保质保量地完成工作,因为我们知道,稍有懈怠就可能与终身教授的职位说再见,一同失去的还有获得稳定生计的最佳机会。

我听到的劝阻之声已经多得够我用一辈子了(可能下辈子也够了).

有上万个类别的数据集有什么用?大部分模型连一两个类别都识别不准!

你知道用这么多图像训练一个模型要花多长时间吗?这个时间可是用"年"来计算的。

别人要怎么下载呢?你这个图像总量比大多数硬盘的存储量还要大。

具体怎么做,你有计划了吗?几百万张图谁来做标注?要花多长时间?怎么验证所有内容的准确性呢?

(5)ImageNet

李飞飞坚持要做,这个通用图片集起名为 ImageNet。那时是2006年。

她想到一个思路,英语词典有一些基本名词,用来解释其他所有物品。只要统计一下,基本名词有多少个,每一个又有多少变体,那就得到了所有物品的基本类别。

统计结果是3万类。因此,李飞飞估计,ImageNet 将有3万个类别,总共包含2000万张图片,每张图片都要有分类和标注,需要从几亿张图片里面筛选出来。

我们发出了邮件,招募愿意帮忙从网上下载和标注图片的本科生,工作时间灵活,每小时10美元。我们招募到一些学生,但是按照这样的进度,完成整个项目需要19年。

这太慢了,项目方法做了改进,用脚本自动去谷歌搜索图片,然后抓取。但是这样也需要人工核对和筛选,只把19年的时间缩短到18年。

幸运的是,亚马逊刚刚发布了众包平台"土耳其机器人"(Amazon Mechanical Turk,AMT)。在这个平台上,你可以出钱,通过互联网,把任务分包给世界各地接活的人。

他们通过这个平台,将 ImageNet 分包出去,投入的人数一下子扩展到几千人,而人均费用只是原来的几十分之一。

2009年6月,ImageNet 的初始版本终于完成了。我们成功达成了目标:收集了1500万张图片,涵盖了2.2万个不同类别。这些图片筛选自近10亿张候选图片,并由来自167个国家的4.8万多名全球贡献者进行了标注。

(6)ILSVRC 算法竞赛

ImageNet 虽然完成了,但在学术界毫无反响,没有太多人关注。

我们遇到了第一个也是最严重的挫折:在当年的"计算机视觉与模式识别大会"上,ImageNet 被降级为"海报展示"。

所谓的"海报展示"是一个学术术语,意味着我们将不能在演讲厅内向听众展示我们的工作,只能在会场的指定区域里摆放一幅印有项目摘要的大幅海报,希望能引起路人的兴趣。

我想过 ImageNet 可能被证明是对的,也可能被证明是错的,对于这两种可能性,我都做好了准备。无论是哪种结果,都会是一个学习的机会。然而,我万万没想到,它被忽视了。

由于 ImageNet 得不到承认,李飞飞想到一个办法,她要每年举行一次算法比赛,看看哪种算法识别 ImageNet 图片集的正确率最高。

这样一来,在计算机视觉领域,ImageNet 就会成为一个比较基准,各种算法都需要用它表示自己的识别能力,大家就不会忽视它了。这个比赛叫做 ILSVRC(ImageNet 大型视觉识别挑战赛,ImageNet Large Scale Visual Recognition Challenge)。

2010年,第一届比赛令人失望,11个团队提交了35个参赛算法。冠军算法是传统的图片向量比较,并无创新之处,正确率也不高。

2011年,第二届比赛更惨,获胜算法还是图片向量比较,正确率只提高了2个百分点。这意味着,没有任何创新和进展。

最糟糕的是,参赛人数也出现急剧下降,参赛算法从35个减少到15个,愿意为此付出努力的人似乎越来越少。

说这种经历"让人羞愧"已经远远不足以描述我们的心情了。为了推动 ImageNet 的发展,我们倾注了多年的心血,搜集的图片数量远远超过以往的任何数据集,还精心策划了一场国际竞赛来探索它的能力,但结果却只是简单地重复了现状。如果说ImageNet 是一场赌注,是时候开始思考我们是不是已经输了。

眼看这个项目就要失败了,几年的心血付之东流。就在这个时候,李飞飞人生最大的惊喜和反转来临了。

2012年,第三届比赛,一个加拿大团队使用被学术界遗忘已久的卷积神经网络,一举将图片识别正确率提高了10%。

接下来的事情,就是被写进教科书的历史了。全世界被神经网络的效果轰动了,AI 研究出现突破,人类进入 AI 时代。

李飞飞彻底翻身,一举成名,从助教变成世界知名的 AI 研究领头人物,人生从此海阔天空。

她的故事令人感叹,如果神经网络算法没有在2012年出现,而是再晚几年,或者更早一点,亚马逊的土耳其机器人众包平台没有在2005年诞生,一切会怎样?

这就是时运吧。科学家的人生和科学发现一样,都是由一些偶然事件推动的。个人奋斗固然重要,但是关键时刻还是离不开幸运。

科技动态

(1)传统的脑电图,需要在头上布满电极(下图),有很多限制,也不舒适。

美国宾州大学的科学家,发明了一种头发电极,细得像头发一样,可以直接粘在皮肤上,淋浴和运动也不会掉下。

这种电极目前还是有线的,但是有计划开发无线版本。

(2)百度地图在导航路面植入广告。

(3)谷歌的 AI 笔记应用 NotebookLM,可能很快就会添加"视频概览"功能。

它已经支持生成音频和 AI 问答,如果再支持生成视频,简直难以想象,是否还需要真人老师。

直接上传课本,它就生成讲课视频了。

(4)安卓官方的桌面模式,泄露了运行照片。下图是它的多窗口模式。

但是 Android 16 可能来不及,发布要等到 Android 17。

手机当作桌面电脑,已经不远了。

(5)百度公布"动物语言转换方法、装置、电子设备及存储介质"专利,使用 AI 识别动物的情感状态,转换为人类能够理解的语言,从而实现动物与人类之间的情感交流和理解。

文章

1、一段让 Chromium 机器人崩溃的代码(英文)

作者介绍了一段 JS 代码,让Chromium 无头浏览器(Puppeteer 和 Playwright)崩溃。它可以用来识别,访问者是不是机器人。

2、Git worktree 简介(英文)

Git 仓库同时只能有一个工作区,如果想同时建立多个工作区,可以使用 git worktree 命令。

3、用 Go 移植 TypeScript 的重要影响(中文)

微软官方要用 Go 语言重写 TypeScript 项目,本文分析这样做的目的和影响。(@imbant 投稿)

4、为什么大模型可以控制手机(中文)

开源项目 droidrun 可以通过大模型,以自然语言操作安卓手机的 APP。本文分析它是如何做到的。(@lezhi12 投稿)

5、创业公司可能无法承受微服务(英文)

本文提出,微服务需要很强的运维能力,并会增加代码复杂性,创业公司不要盲目采用,单体应用更简单。

6、从 Prettier 和 ESLint 迁移到 BiomeJS(英文)

BiomeJS 是用 Rust 语言写的工具,对 JS 代码进行格式化和语法检查,速度极快,可以取代 Prettier 和 ESLint。

7、如何自己托管 Obsidian(英文)

Obsidian 是一个优秀的笔记软件,作者给出详细步骤,自己托管 Obsidian 服务器,从而在任何地方都可以通过浏览器使用。

工具

1、Void

开源的 AI 代码编辑器,Cursor 的替代品,基于 VS Code。

2、Hyvector

在线的矢量图(SVG 文件)编辑工具。

3、Karakeep

一个自搭建的书签 App,提供全文搜索和 AI 自动分类标签,参见介绍文章

4、PairDrop

局域网传输文件的 Web 应用,代码开源,类似于 ShareDropLocalSend

5、zVault

NAS 操作系统 TrueNAS 原本基于 FreeBSD,正在转向 Linux。zVault 是一个社区的分支,由社区推动继续在 FreeBSD 开发。

6、YAMLResume

使用 YAML 格式创建简历,并通过 LaTeX 输出 PDF,方便进行版本管理。(@xiaohanyu 投稿)

7、AllinSSL

开源的 SSL 证书自动化管理平台,集证书申请、管理、部署和监控于一体。(@KincaidYang 投稿)

8、Basecoat

一套基于 Shadcn UI 的组件库,但是不使用 React。

9、Scraperr

网络爬虫的 Web 控制台。

AI 相关

1、MathModelAgent

开源的 AI 应用,自动完成数学建模,生成一份完整的论文。(@jihe520 投稿)

2、BiliFilter

基于本地大模型的 Bilibili 弹幕过滤器,对弹幕分类过滤。(@ddddng 投稿)

3、AI 语音克隆

免费的语音克隆工具,3 秒录音克隆人声。(@xiaodaidai0701 投稿)

资源

1、I Don't Have Spotify

一个音乐搜索引擎,输入 Spotify、YouTube、Apple、SoundCloud 的音乐链接,它会提供该音乐在其他网站的链接。

2、IPinfo Lite

地理位置数据库 IPinfo 推出的免费服务,IP 查询地理位置,无需信用卡,API 请求次数不受限制。

1、Web Component 教程

英文的 Web Component 入门教程。

图片

1、数字键盘的样式

数字键盘来源于电话。

早期的电话都采用旋转的拨号盘。20世纪50年代,电话可以长途直拨了,拨打长途电话需要输入11个号码,拨号盘就太麻烦了,导致了数字键盘的诞生。

1955年,AT&T 公司的研究人员,做过一个研究,10个数字的小键盘应该怎样排列,效率最高?

他们一共列出了15种排列。

经过研究和比较,用户更喜欢从左到右、从上到下的布局。

具体来说,两排五列水平布局与现在普遍使用的 3x3+1 布局速度相当,差异很小。

AT&T 公司最终为电话选择了 3x3+1 布局,主要原因大概是它比较紧凑。

文摘

1、我第一次加入创业公司的教训

一位开发者大学毕业后,加入了一家创业公司。

他逐渐发现,公司内部有很多矛盾,产品决策也有失误。

最终,公司开始走下坡路,他就提交了辞呈,放弃了自己的期权。

离职后,他写了一篇文章,总结了自己得到的教训。

(1)即使创业公司的每个员工都很有动力,但如果创始人并非顶尖人才,那么取得巨大成功的机会很低(但你仍然可以从中学到很多东西)。

(2)创业公司只有两种工作:开发和销售。如果创始人既不做开发,也不做销售,不知道他在做什么,那就相信你的直觉吧。

(3)创业公司的产品还未得到市场验证的情况下,为多个平台构建原生应用,是一种极其低效的行为。如果同时为两个产品在每个平台开发两个原生应用,简直是疯了。

(4)创业公司的路演,大多是浪费时间。产品的验证来自于与用户交流和迭代,而不是打动评委。

(5)没有什么比并肩作战、共同实现梦想更神奇的了。如果你经常见不到创始人,所有的沟通都只能通过远程进行,那可不是好兆头。

(6)如果创业公司没有经过严格的面试,就录用了你,这是一个危险信号。他们到底是基于能力来录用你,还是因为你是第一个同意只收很少的报酬,就为他们工作的工程师?

言论

1、

科学项目日益大型化和制度化,使得个人的好奇心和创新,对于科学的推动正在减弱。科学的进步越来越依靠有效的组织和大量的投入。

-- 《思想家和实干家》

2、

除非你参与过历史遗留项目,否则你不能自称高级工程师。

-- infobip.com

3、

是什么让硅谷的公司如此强大?

不仅仅是它们数十亿美元的资金或数十亿用户,也不仅仅是因为它们拥有惊人计算能力和数据储备,让学术实验室的资源相形见绌。它们之所以强大,是因为成千上万个才华横溢的人在同一个屋檐下共同努力。

-- 《李飞飞自传》

4、

以前的小团队是1名高级开发人员 + 5名初级开发人员,以后是1名高级开发人员 + AI 大模型。

-- Hacker News 读者

5、

我打赌,以后的工程师必须深入底层,更接近硅片的层面。开发应用程序将不再需要精通技术的人,AI 让每个人都可以开发自己的应用程序。

-- Hacker News 读者

往年回顾

OpenAI 的图书馆工位(#301)

国产单板机值得推荐(#251)

中国需要成立半导体部(#201)

NFT 是什么,听说能赚钱(#151)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月16日

Original post on 科技爱好者周刊

2025-05-09

科技爱好者周刊(第 347 期):冷启动的破解之道

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

烟台的"耕海1号"海洋牧场,是一个大型的网箱养鱼基地,同时也是海上休闲观光平台。(via

冷启动的破解之道

新软件有一个超级难题,就是发布的时候,没有用户

这叫做"冷启动",比喻汽车在冬季发动,天寒地冻,很难点火成功。

我最近读了一本书,专门研究这个问题,新软件怎么才能有用户?

书名就叫《冷启动问题》(The cold start problem)。

它的作者是安德鲁·陈(Andrew Chen),美国著名的风险投资家。

他自己创业过,也做过高管,还投了很多创业公司。

他觉得,冷启动是创业公司的头号难题。做出产品不难,找到用户才难。

只有解决冷启动,用户不断增长,项目才能生存和发展。

这本书的有些论断,让我感到很有意思,跟大家分享。

第一点,他提出,解决冷启动,要靠网络效应

什么是网络效应?就是通过人与人的连接,增加产品粘性,吸引并留住用户。

最好的例子就是电话。电话也是冷启动,早期只能跟一个固定对象通话,就像对讲机,想用的人很少。

只有组成电话网,它才变得真正流行。入网的用户越多,越能留住用户。

说白了,网络效应就是你的产品要有这样一个功能,能让用户之间产生连接。

第二点,新产品发布的时候,最好自带一个"原子网络"

原子网络就是最小用户网络,以最少的用户数量,让网络功能生效。

你找亲戚朋友也好,花钱拉人也好,总之要组成一个原子网络,让新用户一进来,就能感受到一个已经生效的用户网络。

第三点,原子网络的大小,根据产品不同而不同。经验法则是,原子网络应该让新用户可以坚持使用3分钟

如果低于3分钟,就表示网络功能太弱,可能不足以留住人。

(1)Uber:网约车的原子网络应该包含15-20辆车,让用户能在3分钟内叫到车。

(2)Airbnb:民宿的原子网络应该包含300套房子,也就是300个房东,供用户挑选。

(3)reddit:社区平台的原子网络应该有1000个子频道,让不同的用户都能找到感兴趣的频道。

(4)Slack:讨论群组的原子网络应该有3个人,并已经产生了至少2000条消息。

第四点,有些产品只是单纯的工具,不具备人际网络属性,怎么办?安德鲁·陈认为,如果产品没有网络属性,就要加上

用户为工具而来,为网络而留。

Instagram 最早只是一个照片滤镜 App,根本留不住用户,人们用了几次就走了。

后来,它转型成照片分享网络,添加订阅机制,让你订阅其他人的照片,一打开就看到好友的照片流。

这个变动让 Instagram 上线 18 个月后,被 Facebook 以10亿美元收购。

其他例子还有,Yelp 最初是一个本地商家的目录工具,后来变成了商家评价网络。LinkedIn 最初是一个在线简历工具,后来变成了职业人脉网络。

总之,你想要网络效应,就必须变成网络。

第五点,只要(一个细分市场的)用户网络达到2万人,就能自己不断变大,最终覆盖整个市场。

也就是说,2万用户是单一市场的阈值,突破这个数量,就渡过了冷启动。

万「友」引力计划:7天倒计时

字节旗下的 AI 原生 IDE---- Trae,最近有大动作。

它发了新版本,正式支持 MCP 服务器,并且大模型免费用,比如 Doubao、DeepSeek、Claude、Gemini、GPT-4o 都不收费(海外模型需要 Trae 海外版)。

为了让更多同学尝试 AI 编程,它推出了 万「友」引力计划。活动在五一前就开始了,现在是最后7天倒计时

活动规则很简单:轻松完成任务,赢积分,兑礼品

(1)安装 Trae,连续两天使用一次 AI 功能,就可兑换网易云音乐或 qq 音乐会员。

(2)邀请有礼:成功邀请 1 位好友下载并使用 Trae,就可获得积分,邀请越多,奖励越多,有华为 MatePad Air、雷蛇机械键盘、京东购物卡等。

机会难得,既可以学习 AI 编程,又能拿奖品,大家不要错过哦。

扫码上方海报,或者点击这个链接,了解活动详情。最后7天了,转发活动,找技术搭子,一起来参与。

科技动态

(1)Meta 推出了新应用 Meta AI,跟 ChatGPT 竞争,底层是 Llama 4 模型。

它的一个亮点是,可以控制 Meat 的智能眼镜,允许你从眼镜上调用 AI。

(2)一支法国研究团队,准备把鲈鱼胚胎(下图)送上月球,检验月球养鱼的可行性。

他们的想法是,月球上最容易活的植物是藻类,鱼食用藻,人食用鱼,从而解决宇航员的食物问题。

(3)一家中国照明公司推出了"AI 台灯"。

它有一个手机 App,用户对着手机说出场景("我正在看电视"),AI 会自动调节灯光模式,并给出备选模式。

(4)华硕的 RTX 50 显卡,被发现配备了陀螺仪和加速度计。

现在的显卡越来越重,突破了2公斤,插在机箱里,几乎必然发生倾斜或下压。这些传感器能够立刻发现,发出警报。

(5)美国建造了世界第一家 3D 打印的星巴克

3D 打印建筑的成本低,工期短,可以快速复制,很适合临时性建筑。

(6)欧盟规定,2027年开始,交易商不得提供加密货币的匿名账户,即必须实名交易。

文章

1、ChatGPT o3 可以识别照片拍摄地(英文)

如果你给 o3 模型一张照片,问它这是哪里拍的,它会猜得相当准确。

举例来说,上图是加州海边的某个村庄。因为 o3 用街景地图训练过,如果碰巧你也在这个位置拍摄,它会给出极准确的位置(这是坐在xx咖啡馆,对着窗外拍摄的)。

还有一篇相关文章,人类的专业级选手(下图)与 o3 比赛,谁猜地点更准,里面有各种实例。

这件事告诉我们,AI 时代上传照片必须非常小心,你会透露自己的位置。

2、Deno 的衰落(英文)

作者认为,Deno 作为一种 JavaScript 的运行环境,最近出现了很多问题,业务在收缩,前景不乐观。

3、如何命令行设置新 MacBook(英文)

macOS 内置了一些命令行工具,可以快速设置系统,非常适合用来配置新电脑。

4、使用 Zip 炸弹保护服务器(英文)

作者痛恨网络爬虫,决定使用 Zip 炸弹对付它们。

zip 炸弹就是一个体积很小的压缩文件,但是解压后却极其巨大(比如 10GB)。

5、Astro 框架的架构(英文)

著名程序员 Dan Abramov 解释 Astro 框架的设计思想,以及它与 React 的服务器组件的差异。

工具

1、BongoCat

一款开源的桌面宠物,支持 macOS、Windows 和 Linux。(@ayangweb 投稿)

2、Barcode Maker

开源的条形码和二维码生成网站。(@LeonZeng919 投稿)

3、Fread

开源的"微博客"安卓客户端,同时支持 Mastodon、Bluesky、RSS 三种协议。(@0xZhangKe 投稿)

4、DeckTap

局域网的演示遥控器,在电脑上运行它,手机连上电脑,就能无线遥控幻灯片演示。(@Rico00121 投稿)

5、Input Source Pro

Mac 电脑的开源小工具,方便切换输入法,可以指定不同应用/网站的默认输入法。(@runjuu 投稿)

6、QBin

开源的在线文本编辑与分享服务,可以用作个人的文本、代码、图片、视频分享网站。(@kfcx 投稿)

7、EasyEditor

开源的低代码引擎,用于可视化搭建 Web 应用。(@JinSooo 投稿)

8、PakePlus

一款桌面应用,使用 Tauri2 将任意网站打包成桌面应用和手机应用。(@Sjj1024 投稿)

9、柠檬表单

开源的表单问卷系统,类似于金数据和飞书问卷,自带管理后台。(@bojue 投稿)

10、MotionEaseTune

一个安卓应用,通过播放 100Hz 声音来预防晕车,项目开源。(@BHznJNs 投稿)

11、OpenApi 接口代码生成器

一个命令行工具,根据 OpenAPI (swagger)文档,生成各种编程语言的客户端接口代码。(@otk-final 投稿)

12、MyOCR

一个基于 Python 的本地 OCR(文字识别)框架。(@robbyzhao76 投稿)

13、SimonAKing-HomePage

一个使用 WebGL 流体动画的个人网站模版。(@SimonAKing 投稿)

14、酷监控

开源的监控(网站/接口/HTTPS 证书)控制台,支持 Docker 一键部署。(@star7th 投稿)

15、FindJSONPath

在线的 JSON 工具箱,可以生成 mock 的 JSON 数据,以及可视化选中某个路径。(@bingobray 投稿)

16、拼字幕

在线制作字幕拼图的工具,上传图片、填写文本即可。(@xiaoshangmin 投稿)

17、YouTube Playlist Processor

这个工具用 AI 将 Youtube 播放列表转成一本电子书,参考这篇介绍文章

资源

1、素材 SoSo

免版权的图片和视频素材搜索引擎,支持语义搜索。(@YeDaxia 投稿)

2、FeedMe

提供多个信息源最新内容的 AI 摘要,代码开源。(@Seanium 投稿)

3、吉卜力电影的高清图

吉卜力工作室的官网,放出了它们几乎所有电影的几百张高清图。

图片

1、盘式胶卷

1982年,柯达公司推出了盘式胶片相机。这种相机的胶片不是传统的一卷,而是一张张放在圆盘上。

上图的圆盘,外围的一圈就是一张张胶片。

这张设计的好处是,胶片相机可以做得很薄,塞在口袋里。

这种相机的卖点是廉价和便携,最便宜的型号只要68美元。但是,它的胶片比标准胶片小很多,导致画质不佳,而且一张圆盘只能拍15张照片,并且需要专用的冲印机。

这些不利因素导致这台相机只生产了6年,到1988年就不得不停产。

文摘

1、约翰·巴洛的人生格言

约翰·巴洛(John Perry Barlow,1947-2018)是一个美国的著名作家。

60岁生日的那一天,他告诉朋友,他的一生有25点信条,是一直遵守的。

其中有几条,表达了一个核心观念,就是时刻对自己、对他人保持怀疑,不要坚信不移。

(1)拓展你对可能性的感知。所有事情都是可能的。

(2)容忍模棱两可。有些事情是不确定的,说不清是好是坏,是对是错,要容忍这样的事情。

(3)经常自嘲。永远不要忘记,无论你多么确定,你都有可能犯错。

(4)要关心什么是对的,不要关心谁对谁错。

(5)一旦发现自己错了,不要放过,也不要不承认。

(6)懂得谦逊和原谅他人。

2、Web 开发的未来

这篇文章发布于25年前,现在的标题如下。

Web 开发的未来是 AI,要么加入,要么落后

历史上,我曾经多次修改标题。为了便于后人参考,我把它们依次列在下面。

Web 开发的未来是区块链,要么加入,要么落后

Web 开发的未来是 CSS-in-JS,要么加入,要么落后

Web 开发的未来是渐进式应用,要么加入,要么落后

Web 开发的未来是 Silverlight,要么加入,要么落后

Web 开发的未来是 XHTML,要么加入,要么落后

Web 开发的未来是 Flash,要么加入,要么落后

Web 开发的未来是 ActiveX,要么加入,要么落后

Web 开发的未来是 Java 小程序,要么加入,要么落后。

文章的正文一直不变。

如果你不使用这项技术,那你就是在搬起石头砸自己的脚。

它在未来一定会占据主导地位,发挥重要作用。如果你不使用它,你就会失业。它解决了我们遇到的所有开发问题。

购买我的5000元课程,我来教你,如何学会它。

言论

1、

上个月的流行词是"氛围编码"(vibe coding),本月的流行词就是 MCP 了。

-- 《我的 AI 笔记》

2、

两个想法之间的差距越大,它们的结合就越具有原创性和令人惊讶性。

-- 尤德·肯尼特(Yoed Kenett),美国心理学家

3、

心甘情愿地接受限制,可以增强而不是抑制创造力。

-- 《受约束的创造力》

4、

AI 研究的最终目的是,它编写我们不理解的程序,来解决我们不知道如何解决的问题。

-- 莱斯利·兰波特(Leslie Lamport),美国著名计算机科学家,排版系统 LaTex 的创始人

5、

人们在夜晚和周末所做的事情,代表了世界上所有未充分利用的时间和精力。

-- 安德鲁·陈《冷启动问题》

往年回顾

三十年,解决人生三大问题(#300)

新技术的最大风险(#250)

低期望,多尝试(#200)

当音乐还是稀缺的时候(#150)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月 9日

Original post on 科技爱好者周刊

2025-05-01

谷歌的 NotebookLM 能生成中文播客了

两天前,谷歌发了一个公告

它旗下的 AI 笔记产品 NotebookLM,现在支持50种语言生成播客了(原来只支持英文)。

我一定要分享这个消息,终于能生成中文播客了。这是我一直想要的功能,相信也是很多朋友想要的。

我演示一下,大家听听效果,会惊到你的。

首先,访问它的官网,点开右上角的设置,选择"Output Language"(输出语言)。

切换到"中文(简体)"。

然后,在首页新建一个笔记本。一般来说,一个学习主题,对应一个笔记本。

作为演示,我新建了一个"中国小说"的笔记本。进入后,在 Source(原始材料)标签页上传了鲁迅的《阿Q正传》。

注意,上传的文件格式目前只限于 PDF、TXT 和 Markdown。

另外,经过我测试,如果是图片扫描的 PDF 文件,它会自动进行文字识别。

接着,切换到 Studio(工作室)标签页,点击 Generate(生成)按钮,它就开始生成播客。

几分钟以后,播客就生成了,里面是一男一女在谈论你上传的资料。

大家听听看,是不是很像那些精心准备的真人播客。

NotebookLM 不仅可以上传文本材料,还可以针对网站和 Youtube 视频,生成播客。

我随便找了一个 Youtube 的英文视频,内容是国产旗舰手机的摄影能力比较。

下面是生成的播客

我听了以后,觉得都不必看视频了。而且,中文播客比英文视频,更容易抓住重点。

总之,有了中文播客以后,任何枯燥的学习资料,都能变成平易近人的播客节目。走路、休息、锻炼、开车的时候都能听,学习时间和途径都变多了。

需要注意的是,免费账户一天只能生成三个播客,更多需要付费。

除了播客,NotebookLM 的 AI 笔记功能,也非常好用。

你可以上传自己的学习材料,也可以用它搜索某个主题的学习材料。

下面是我用它搜索 PostgreSQL 数据库的学习材料。

指定学习材料以后,你可以跟这些材料聊天。

它还会自动生成各种笔记:学习指导、内容摘要、常见问题、时间线等等。

以上就是 NotebookLM 的基本用法。

我的评价是,NotebookLM 是一款革命性的笔记工具,属于少数几个真正有重大用处的 AI 产品。

它会改变做笔记的方式和学习方式,每个学习者都应该知道有这样一个工具。

它属于谷歌的产品,似乎还没有竞品,希望国内的厂商能够做出替代品。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月 1日

Original post on 科技爱好者周刊