50 / 告别 UI “玄学”,我的 10 倍速语音数字化流程,以及云南的年轻人不会猝死
你好,我是 Bear 大狗熊。
这一周我过得非常有“掌控感”。这种掌控感并非来自对手头工作的压榨,而是来自一套刚刚跑通的、极其顺滑的语音输入数字化流程。在咖啡馆里,当我看着几十个音频文件在脚本和 AI 的协作下,自动转化为整齐、带有标签的 Obsidian 笔记时,那种“找到属于自己的第二大脑”的兴奋感真的难以言表。
当然,生活中也有轻松和反思的时刻。我在大理的咖啡馆偶遇了一位用帽子遮脸、在阳光下坦然昏睡的姑娘;也正因为回国这段时间的网购体验,对堆积如山的快递包装感到了环保层面的深深焦虑。
本期我会分享这套能用 10 年的记录系统细节,聊聊为什么 UI 设计不好往往不是审美问题,以及我是如何让 AI 用不同人格来“挑战”我的记录习惯的。
本周推荐
545 /《Refactoring UI》:UI 做不好,往往不是审美问题
如果只推荐一本书给开发者和创作者,我几乎不会犹豫,答案是 Refactoring UI。
不是因为它教你“什么风格好看”,而是因为它直接告诉你:什么地方一定是错的。
很多人卡在 UI 上,并不是审美差,而是不知道问题出在哪。界面看着别扭,却只能凭感觉反复修改。
这一期里,我聊的是《Refactoring UI》如何用大量前后对照,把 UI 从“玄学”拉回到可判断、可修正的层面。
如果你做产品、写代码、独立开发,或者经常需要在没有设计师的情况下做界面,这一期会非常实用。
收听:这里
Google Stitch 惊人的设计效率
今天第一次试用了 Google Stitch 这个设计生成的服务,哇,效果相当惊人。
我目前项目的 Landing Page,用它可以按照思路很快地生成不同的版本。另外我也发现这个工作流程其实是很容易衔接到Figma设计流程的,因为当生成的文件 Stitch 可以打包成一个 ZIP 文件,直接用 HTML to Design 的插件就可以将其导入到 Figma 里面来用。
那个插件每个月有 10 个免费导入的名额,如果付费的话一个月是 18 美元。假设有大量设计的话,其实也 OK。
咖啡馆的“昏迷”少女
在咖啡馆吃午饭。旁边有个姑娘摊在懒人沙发上晒着太阳帽子遮着脸睡午觉。不一会儿,她的手机响。
她接起来应付了几句,估计是工作电话,然后说:“等我一会儿忙完给你再回吧。”对方好像问什么时候,她说大概一小时吧。接完又继续晒着太阳昏睡过去了。
感觉云南的年轻人应该不太容易会猝死吧?
语音输入数字化流程
在咖啡馆花了一个小时左右,将自己的语音输入数据化的流程完全跑通了。
现在操作非常简单:当我把所有的音频文件导入到电脑时,第一步,先将它们全部执行一个苹果的自动脚本,把 Wave 文件转化为 M4A 文件。这个操作是在苹果自带的 Automator 里面做的,非常简单。做完以后,整个文件的体积大概可以下降 10 倍。
第二步,是用一个免费的开源音频转录软件 Buzz,将所有音频转录成原始的文字,不做任何修改删减。这使得每一个音频都会对应一个 TXT 文档。
第三步,是用一个 Python 脚本将所有的 TXT 文件合并成一个 MD 文档,用时间戳来作为标题。一级标题是日期,二级标题是具体记录的时间。这个原始文档也需要存档,以后可能会需要查看。
这时原则上就可以把音频文件和转录后的 TXT 文件全部删掉了,但我会保留已经转存过的 M4A 音频文件,因为这也是原始的记录,其中记录的语气、节奏以后可能会用得到,所以非常有意义,值得把它留下来。
第五步,是用 Gemini 直接对转存好的 MD 文件(我命名为 Weekly Raw 的文件)进行优化。原则是不删除和增加任何内容,只是对其文字阅读的流畅性进行优化,保留原文语意。输出时按照语意内容生成一个标题,再加上时间标签、场景标签和具体的类别标签,便于以后索引。
常见的大语言模型在处理长文件时,最后往往会偷懒、会出现简化的现象。我的解决办法是让大语言模型直接调用 Python 然后分批处理,也就是按天进行整理。这样的话,每一天都是一个标准的文件处理节点,不会出现被“吞噬”的情况。提示词很关键,但我已经整理好了提示词。
最后一步也是附加的,就是把最终输出的文件存到 Obsidian 里。我的计划是按天进行保存,因为我每天除了音频的输入之外,还会有手写的晨间笔记输入、手绘图和其他图片,这些都会按照天的单位进行保存。只要加好标签,以后用 DataView 动态视图,就可以把某一分类全部摘录出来,便于下一步的处理。
我的习惯是把所有的日记都加上 #Diary 这个标签,通过过滤就可以把原始记录里的所有日记全部摘抄出来。同样的,也可以针对工作的计划进行管理。Obsidian 就可以成为一个创作思想和素材的内容库。
这个方式应该可以用五到十年。Obsidian 我不会展开来用,就只用这个场景就够了。当内容创作成稿之后,我会将完成品继续用 Notion 来进行管理。
有一个小细节是关于隐私,就是这些记录里面可能会有一些私密的信息。但我觉得在目前这个阶段,更多是对个人信息采用“拥抱变化”的方式。如果真想要全部的信息都是绝对私人的,可能需要私人大模型,但我觉得目前我还没到那种程度。
快递包装与垃圾泛滥
感觉我才回国了不久,就制造了特别多的垃圾啊。淘宝买的东西,每个都是包装箱、包装纸、塑料纸。偶尔外面买的东西点个外卖,哪怕是买个面包都有手提袋。
垃圾的制造程度实在是太夸张了。但我不知道现在这已经成了一个产业,这些垃圾都可以回收么?以中国的人口体量,加上这种网购和外卖的频率和数量,这些垃圾造成的环境压力还是挺不可想象的。
AI人格挑战与记录观
我刚刚做了一件很有意思的事,就是把我现在的这种用语音记录和整理生活思考的方式整体叙述了一遍,然后让 AI 分别用三个不同的人格来反驳我。
我让他用那种“灵性”的人(即高感性、低理性的人),让他用“极致的利己主义者”(一切都看投资回报率的那种),还让他模拟 20 岁的 TikTok 用户来分析。
给到我的这些反馈其实还挺有启发。比如他提到:这种对生命如此细致的记录感觉“非常不性感”;另外,这种感觉像是“在用蒸汽机时代的东西来对话新的世界”。
但我现在还是打算继续。语音这种方式其实已经形成了一个非常好的输入输出闭环,跟我原先的记录方式也基本上差不多,我会坚持下去。原先我会每天进行这种碎片式的整理,它的好处是即时性比较强,真的就像反驳我的意见里说的,是在一个想法正在新鲜时把它发布出去。而现在这种记录是批量的、整体的整合,没有那么及时,但可能从时间各方面来看更容易沉淀。关键是这些内容也是在我的存储里,它不会消失。而且我觉得之前那种随时发布会打乱我的节奏,很多时候让我跟着算法和流量在走,让我的情绪和状态受那些影响太多。
但对于我的晨间笔记、手写的文字以及我的手绘,我打算在这方面坚守阵地。没有必要每周整理,只是在每写完一个本子之后再对它进行整理。而且最好是在一个本子写完、对其有了批注(也就是我已经翻阅过它们)之后再去整理。这样做,一是不至于让自己陷入到那种“整理的漩涡”里,觉得每周都是好多任务去做;二是可以让这些手写文字的温度得以保存,因为毕竟我需要手工再去翻阅、查看,这一点非常重要。
你好,我是Bear(中文呢称大狗熊),是一位互联网产品设计师、用户体验设计导师、获奖双语播客主播、高效阅读践行者,现住在新西兰的奥克兰,我喜欢分享自己的工作与生活学习感悟,帮助大家一起成长。
《Bear学习派》是我每周通过邮件发出的关于科技、设计与效率的中文心得分享,涵盖好书解析、学习经验和职业感悟。订阅这个newsletter,与 5000+ 位朋友一起学习进步:)
订阅邮件通讯 Newsletter
💌 Bear.Academy: 我的每周邮件通讯,分享海外设计、职场的经验、技巧与工具,免费订阅。国内用户也可以通过小报童平台(
https://xiaobot.net/p/BearAcademy)订阅(有每季度10元人民币的最低收费)
联系 Contact
https://twitter.com/bearbig - 我目前主要活跃的社交平台
bear@beartalking.com - 我的常用邮箱
LinkedIn.com/in/bearliu - 我的主要英文社交平台








