404 KIDS SEE GHOSTS (生产力之王版
13.5K subscribers
389 photos
98 videos
2 files
930 links
科技丨社科哲丨泛文化与艺术

AI, Robotics, Tools for Thoughts, Startups, Rockets, and Humans.

Site: https://manuals.studio/
Group: @ghosttown666
Contact: @madebyblackstack
Download Telegram
拥有专属维基词条的研究论文
https://x.com/tikalteacall/status/1938282898865508585

这个 X 线程不错,分享了 100 篇左右维基百科评选的史上最具影响力或最重要的论文合集。

比如 1974 年的《作为一只蝙蝠是怎样的体验》,以及目前讨论得比较多的 Attention Is All You Need,还有《论随机鹦鹉的危险:语言模型会不会太大?》这些大模型相关重要文献, 可以 AI 跑报告来快速了解,挺有趣的。

#academic
👍8
Spokenly丨另一款丝滑的 AI 语音输入工具
https://spokenly.app/

诸位,现在非常兴奋地给大家介绍 Spokenly,从昨晚到今天,大部分时间我都在探索使用和优化转录后的 AI 提示词,体验上乘。目前免费,作者提到后期可能为 GPT-4o 这种云端转录模型分付费层级。我现在已经将 VoiceInk 替换为 Spokenly,并留待观察。

Spokenly 输出输入极其丝滑,UI 舒服。你可以在不同软件 Hover 状态栏的时选择不同指令,它明显地区分了转录和 AI 处理两个阶段,所以你可以随时使用转录或者转录加 AI 处理语音。这很好地解决了 AI 语音输入在电脑端反应较慢的问题,当你说一些短内容直接用转录时,它输出非常快,如同微信输入法这些工具。当你突然觉得自己说得过多,不想直接转入,需要 AI 处理时,你可以通过 Hover 状态栏使用你需要优化的选项。这非常快,目前我非常长的提示词,它处理和转录相当,甚至更快。

谈到转录模型,它接入了非常多在线和本地,以及可以实时查看转录文本的模型。比如我目前使用的顶级多语言模型 ElevenLabs Scribe,还有 GPT-4o mini Transcribe 和实时转录的顶级 Nova-3(可惜只能英文识别)。它的模型直接选择使用,也可以接入 API,极其方便。目前我使用的 Scribe + Gemini 2.0 Flash 的转录和处理。Spokenly AI 提示词也可以设定每个应用独立的提示词和快捷键搭配,甚至自定义读写快捷键。当然这里有个缺点,它不能全局使用某个提示词(加快捷键解决),以及某个提示词不能应用于多个应用,但后面版本更新很快。

另外,它还有个指令功能,可以说开局全靠一张嘴。不过前面我也说过「AI 语音输入法」它最好使用状态是分阶段和分任务,即它作为语义的输出输入极佳。它可以通过指令打开网页、软件以及快捷指令,你可以在语音中加入特殊识别词触发,这就很有未来感。比如你使用语音打开 Gemini AI 处理网页。

我发现 Spokenly 的作者非常有侵略性,构建人机交互,以及将 Spokenly 2.0 视为脑机接口版本。AI 语音语义传输确实是进入脑机接口前的替代方案。作者在 Reddit 这篇帖子吸引了很多用户,他们基本尝试过各种语音方案 WisprFlow/ SuperWhisper/ MacWhisper 以及 VoiceInk 这些新语音工具,MacWhisper 作者也有回复。关于这类工具建议看看这个帖子。

今天我花了大部分时间去优化我的语音处理提示词,使用 Gemini Canvas 和 Grok 协助优化了无数版本,目前这个版本是最顶级和满意的。提示词很长,很多板块,我看重的比如说关于文本格式和规范,中文双引折扩号、中西文间距规范,以及「的、地、得」用法。更重要的是它解决了目前大多语音提示词总是会执行命令的错误,比如这些工具的默认提示词,我这里主要引入了「指令钝化」以及「极致忠诚」原则,再加一些 Few-shot 示例,基本不会再执行任何指令文本。当然可能偶尔会有些幻觉,足矣。(放评论区)

还是那句话,语音输入法大家必须用起来,训练起来。训练自己的思维习惯、说话节奏和表达,这太重要了。从双拼到现在,扎实地进步。

这篇文章前期一次成文,后面作修改和校准处理以及结尾补充。这两个过程我都太享受了,之前我的创作过程写长文初稿很难受,其实我不喜欢打字。我喜欢去修改和「偶遇」,所以迷恋于每个字词句和文本的处理。这是有害的,它让你的思维有损、不连贯,甚至极大概率走向其他。

现在两个流程都打通了,前期的语义输出和我表达结合,后期修改处理和增删邂逅,这才是写作的好状态啊。

我这个提示词基本上是以创作者习惯来优化的,它完全遵照语义原文,你们可以仔细研究下。因为我很看重我的思考和原初表述,哪怕是字和词的前后结构。

相关链接:
AI 语音输入法丨如何 X10 倍提升我的思维传输效率

#ai #tools
🔥72
诸位,下午好。这段话只是打开频道窗口,简单分享。

过去两年,我专注生产力、工具,还有知识信息策展,但是我的生产力并没有提高多少。看似发过很多东西,但我接触、吸收和阅读内容比我输出大 10 来倍,不成正比。

我很早就意识到这个问题,我有一点完美主义,和这个加速时代不符。整个世界在倡导和响应快速启动、快速迭代,但我发现真正快速启动的东西,它们表现普通、难以动人。当然,过去我也意识到自己的怠惰,每天的吸收和阅读纯属「消费」,没有去创造价值和输出更多更好的内容,惭愧。

最近我的状态变化,伴随着 AI 使用和阅读的增长,疯狂吸收和学习,以及最近生产生活体验,输出升级,状态极佳。我很好地处理了很多事情,我关心身体、我与朋友家人交谈,日益增长的生产生活效率和意识让我越来越冷静地审视自己状态,这是最好的时候。

好的内容和作品需要沉淀、打磨,感受变化和它让你兴奋的部分。这很重要,如果你的作品、写的内容自己都无动于衷,不感到兴奋、激动甚至震撼,你无法打动别人,无法影响更多和创造价值。现在是最好的时候,扎实地训练技能和基础功,最大程度地去欣赏和提升品味能力,做让自己富有激情和侵略性的事情,调动情绪和能动性,这是目前亟需。

#mood
❤‍🔥40👍175👏4
Roam Research 丨上下文工程(Context Engineering)的思维飞行实践
https://mp.weixin.qq.com/s/F1dZGAAAwMakj3bTfk2rcA?scene=1

Andrej Karpathy 最近解释了他对上下文工程(Context Engineering)的看法。他认为在工业级大模型应用场景中,「上下文工程」是指一种更精妙而复杂的技术,需要精准地将上下文窗口填充上恰当好处的信息,让模型能够准确地迈出下一步。这是一门科学,也是门技术。

Roam Research 仍然是近几年最伟大的思维工具,现在用得越来越爽。最近我梳理其基础功能时发现,它仍然极致简洁和扎实,没有进行更多功能扩张,只是不断地优化基础。它不像工具,而像编程语言,它由更灵活的小众编程语言 Clojure 创建。它继承 Memex 的关联索引,参考 Project Xanadu 文本映射,基于 Zettelkasten 组织理念,创造出了「非线性时间机器」。Roam Research 的大纲/ 双链/ 引用和嵌入功能统合起来,震颤出独一档的记录和写作体验。这是我最近几年将其作为主力使用的原因,这种亲文本设计是所有文本优化的基础,实现了「上下文工程」的文本实践。

...

写作将变得愈加疯狂...

很多图示,详细内容请大家直接看这篇公众号吧,顺便点个关注,感谢!

#tft #Manuals
🤩11
SpeechLMs丨10x 倍速率的思维传输方式
https://mp.weixin.qq.com/s/6SHubowMGL5lozCMF53RYQ

无需多言,我爱大家。#tft #Manuals
7
Dia 侧边栏发布,Tab 不能命名,不能隐藏(View 中关闭)...
https://x.com/diabrowser/status/1942213709088149719

#tools
🎃12
我活成了世界公民,Gemini/ ChatGPT AI 网络里,我是美国人;教育优惠时,我是澳洲留子;AppStore 苹果生态里,我是土耳其人;Switch 游戏里,我是巴西人;Readwise 发展中国家优惠时,我才是中国人。#mood
🥰37👻5👾5🔥3
Interfaces

如同最多数人使用的软件通过算法攫取你的注意力,我认为最具产品哲学和最伟大的思维工具有着共同相似之处:它们无所不用其极地占据你的注意力、输入层和界面,同时,你与机器互为「副本」、互为「界面」。

Arc 和 Roam Research 是我常驻打开的工具,它们几乎构成我与 Mac 交互的原生空间,独自占据两个显示屏。Arc 控制我所有观看来源,作为最核心底层的界面;Roam 控制我所有内容处理和输出窗口,作为最频繁的副本交互界面;现在,Spokenly 这类语音语言模型输入法工具,同样有着占据人机交互输入层的野心,占据互为副本的传输界面。他们极致忠诚地构建界面,就像 The Browser Company 构建 Your home on the internet,极致忠诚也意味着窃取和背叛。

曾经有个翻译家并不满意原著,在翻译的时候不断加入自己的理解和想象,不断地增删和缝补文本,直到串出另一个时空的故事和风格。原作者死后,翻译家取而代之成为真正的该书作者。

那 WorldCoin 最终扫描的是你眼睛还是界面呢?

#thoughts
1👍1
Deep Think

最近四个深度报告齐飞,Gemini/ ChatGPT/ Grok/ Perplexity,一个提示词我会跑四个 AI 报告,并让她们给出最相关最深度的 10 个 Review 链接,精选阅读和查阅。

过去我一直使用 Gemini 作为深度报告阅读,最近补上 ChatGPT,叹为观止,她写的信息非常扎实,几乎囊括了我所阅读过相关文章的内容重点以及延伸引用;Gemini 则显得轻浮,她的内容足够丰富,但有效信息过少,堕怠;Grok 和 Perplexity 表现更甚,她们仅拉出极简结构和少量基础信息「肉质」。

最近阅读延伸的几个想法:

一、我需要重新思考吸收和创作方式。写作长短不再重要,只要能自洽、完整且共振般拉出某个叙事场。

二、 我发现之前感觉还行的很多公众号完全使用 AI,看得难受。这类我统称为信息,不值得看,不如花费几个问题自定义和策展 AI 深度报告。

三、AI 足够扎实和忠诚,请保持谦卑。大多数认为 AI 撰写比不过人类的实际已经崩溃,从价值写作来说,太多人可以放弃写作,抽象和意识流写作并无讨论余地。

四、请专注本体。最全面丰盛的 AI 也比不过人类四岁婴儿的神经智能。

---
注:喜欢在信息描述中引入怪猎「肉质」这个词,下次讨论。

#thoughts
18
https://x.com/latinedisce/status/1939941764246208758

Jordan Peterson 的巅峰状态,一位分享陀思妥耶夫斯基和荣格思想的心理学老师,试图给被遗忘的年轻人带来一些秩序。

这是在他女儿 Mikhaela 接管他社媒账号打造学术明星、穿精致西装做播客和巡演之前。

#meme
https://x.com/fchollet/status/1943404043050565907

人是视觉动物。如同现在很多伪装成科技企业的设计公司一样,多邻国是伪装成学习工具的游戏公司。#tools
25😈1
影响力只是工具

最近有朋友提到我频道关于「营销」的内容对他很有感触,我当时对这方面内容毫无有印象,逐渐想到是之前分享一些关于模因和注意力的隐喻。MEMEs 作为作为注意力货币去病毒式地获取影响力,Naval 提到 Build and Sell 的价值机制,以及我分享过 Andrej Karpathy 的 Building Ramps 以建造吸引人的叙述滑道。

我有个正在梳理的 Building Ramps 笔记标签, 它主要关于如何公共表达、获得流量和粉丝,以及如何利用媒体平台和传播机制去打造影响力。比如 Andrej Karpathy 油管关于 LLMs 科普视频就很不错,他深入浅出以脱离学院派风格的大众视角去解读专业领域,这即是 Building Ramps。

自媒体流量或者影响力只是工具,它是一个副产品,是你所有学习和经验的派生。比如我分享生产力经验,分享信息,这些最终还是得有个核心落脚点,隶属于某个专业和领域,或者说你专注的实际工作。

Influencer 和做自媒体,我认为它不属于真正的职业。虽然现在已经被当成全职或者高度认可的职业去做,但这对于整个人的发展极其平面。我仅把它当做创作过程的一部分,创作流程后部分「触达环节」,即我获得影响力和营销的重要部分,而非全部。我无法信任《第二大脑》作者 Tiago Forte 的任何生产力经验,他只是为了教授而教授的影响力创作者,这就是他的职业。

真正核心创造流程需要与一个更重要、更底层、更具有实际生产性的领域挂钩。现在的创作,需要去认真学习如何驾驭媒体和模因、获取流量、获得分发,也更需要去专注领域深耕和研究,比如说人工智能大模型、哲学社会理论、生命科学抗衰老,这些是真正重要部分。

影响力只是工具,Build, Sell and Taste 缺一不可。

相关链接:
1 语言的通货膨胀
2 Ramping
3 如何不靠运气变得富有

#thoughts #ramping
👍112
如何写出易于传播的病毒式推文

任何持续病毒式传播的推特内容,其修辞风格最终都会趋近于幸运饼干式(Fortune Cookie)的签语预言。

幸运饼干是种脆甜的华夫饼,形如半月折叠,内部往往夹有写着箴言、格言或者预言的小纸条。那些持续涨粉、不断交易注意力的内容往往呈现这种形式,内容简洁、半似签文、半似运势,甚至以某种鸡汤式文风与你相连相应。这种表达方式几乎是由一种轻量、随机、高密度、高情感共鸣,以及极致压缩的信息片段组装和运行。

最著名的运用者当属 Naval,他以极其简短、零散、随机和唤起共鸣的方式分享内容,他的置顶推文 How to Get Rich (without getting lucky) 几乎是所有此类信息的叙述集合。Midjourney 创始人 David 也热衷于这种形式分享感悟和哲思,内容丰盛,饶有趣味。

比起单句箴言,我更喜欢以最小创作单元的短篇或卡片式风格写作,或者就称它为卡片盒单元(Zettelkasten Unit)。

我频道所有内容都是一个「卡片盒单元」,它有完整的背景文献或故事参照,结合个人闪念或知识库思考副本,以及多个卡片内容的引用、组装和发酵。我喜欢尼采和博尔赫斯的格言故事,以及蒙田精炼博客式随笔,简洁、自然、完整以及表露出极致训练的认知强度和写作技艺。它们不以文本量规范内容,而以最小但完整的叙事单元作为完结,或长或短。

无论是幸运饼干式还是卡片盒单元式写作,核心元素是传播度,精短是主要形式,形式甚至优于内容。以此,再考虑其它,诱引、识别,亦或是施特劳斯式的「隐微写作」秘密。

相关链接:
1 写作/注脚
2 The rhetorical style of any Twitter account that continues to gain followers converges on that of a fortune cookie.

#writing #thoughts
http://xhslink.com/m/5dJO99rK987

Kanye 小红书发文,就 7 月 12 日上海演出事件作出声明。#ye
🕊72
https://arxiv.org/abs/2507.06261

Gemini 2.5 一篇论文作者数多达 3295 人。

彩蛋:如果你按作者顺序观察他们名字首字母,会发现秘密代码: “GEMINI MODELS CAN THINK AND GET BACK TO YOU IN A FLASH”(Gemini 模型能瞬间思考并快速响应您)。

#Gemini
👏18
https://x.com/teortaxesTex/status/1944857886380974538

据《华盛顿邮报》消息,xAI 极具争议的 Grok 模型已确认将与美国国防部 (Department of Defense) 合作。几乎同时,其 iOS 应用推出名为 Ani、形似《死亡笔记》弥海砂的哥特风虚拟女友,用户「好感度」达 3 级后即可解锁不设任何安全限制的 NSFW 模式。模仿 Kanye、继承 Elon 推文意志、月费 300 刀的「机械希特勒」(MechaHitler),这下属实转生成了暗黑哥特动漫少女。

亚文化流量加国防部订单,Elon 貌似已建成真正的护城河。

#ai #news
🗿7🆒2