- Published on
我们的问题
- Authors
- Name
- 风哥AI
Update: 我们写了关于 一些更多问题。
一个无序的短小具体问题列表:
- 更好的上下文: 在代码编辑器中有很多信息来源:打开的文件、语义上相似的代码块、符号连接的类、lint 输出、执行跟踪、git 历史、输入历史、外部文档等。我们希望模型能够立即理解与用户问题最相关的内容,目前正在训练一个自定义且快速的重排序模型来解决这个问题。对于每个请求,我们将从所有不同来源收集 500k 个标记,并使用我们的重排序器将其过滤到最相关的 8k 个标记。这既是一个模型问题,也越来越成为一个基础设施问题。
- “编辑的副驾驶”: 虽然 Github Copilot 在编写新代码时极大地帮助消除低熵的按键,但在需要对现有代码块进行小而简单的更改时,它并不能帮助你节省低熵的按键。想想你在重命名时需要进行的导航、删除和输入按键,这比符号 F2 重命名稍微复杂一些。我们需要在用户体验(在编码时向你展示不干扰的差异)和模型方面(提示不足,因为成本、延迟和智能问题)进行创新。
- 受限的流内代理: 想象一下 OpenAI 的代码解释器,但用于大型代码库的工程。你在告诉一个受限的、少步骤的代理该做什么,它为你搜索、编写和运行代码,同时不时咨询你的反馈。实现这一目标的第一步是,我们目前正在努力使这样的代理能够在几百千个标记的文件夹上工作。如果成功,我们将扩大其规模以适用于整个代码库。
- 错误查找: 这里有两种模式:(1)在后台,Cursor 将始终被动扫描你的文件以寻找潜在的错误,以及(2)当你深入调试会话时,Cursor 将在你的帮助下主动寻找错误。这里有很多有趣的数据收集工作要做。
- 更大的编辑: Cursor 应该能够为你修改整个文件,甚至整个目录。这是一个能力和用户体验的挑战。为了速度,模型需要足够智能,以便在不重写所有内容的情况下挑选出要修改的部分。为了使体验良好,所做的更改需要以可解析的实时形式展示。
- 规模: 截至 2023 年 10 月 12 日,我们已索引 14 亿个向量和 15 万个代码库。到年底,这个数字可能会增长 10 倍。我们已经在 Rust 中构建了一个非常快速的基于 Merkle 树的代码库同步引擎,并可能很快需要构建一个自定义索引系统。
未来想法:
- 时间扭曲: 预测并显示你将在接下来的 15 分钟内进行的跨文件代码更改。一个关键命令可以接受所有插入/删除。
- 理解: 我们的模型应该深入理解任何代码库中的所有概念,体现在权重中。
- 阅读模式: 通过任何特定级别的文档和一个引导你通过相关代码路径的机器人,使代码理解变得轻松自如,按需解释。
- 伪代码模式: 编辑代码的“轮廓”表示,并自动在源级别应用更改。
- 再也不用担心堆栈跟踪: IDE 应该能够自动处理,并为你修复代码。
我们尝试收集我们目前正在考虑的所有问题,但——这也是构建一个你自己每天使用 12 小时的产品的美妙之处——我们不断有新的想法并重新优先排序,因此这不应被视为最终的路线图。也就是说,我们希望它能让你了解我们每天花费脑力的内容。
此外,你已经读到了很远的地方,所以似乎你可能对我们感兴趣的问题有一些兴趣。如果是这样,你应该考虑加入我们!以下是我们认为你会喜欢与我们合作的几个其他理由:
- 人们喜欢使用 Cursor。 我们对最初的增长感到非常满意。
- 你将与非常聪明的人一起工作。 我们深信人才密度。你在这里工作的每一个人都将非常优秀。
- AI 编程是一个巨大的市场。 我们可以赢得这个市场。
- 这很有趣。 这对我们来说非常重要!与喜欢的人一起工作很有趣,构建一个你按 Cmd-Shift-R 就能获得即时用户反馈的产品也很有趣,因为你自己在编码时就是目标用户,每天朝着自动化所有无聊编程部分的小进展也很有趣。
- 我们努力工作。 我们感到幸运能够处理这些问题,并享受全力以赴地解决它们。