V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  noahlias  ›  全部回复第 7 页 / 共 10 页
回复总数  200
1  2  3  4  5  6  7  8  9  10  
你说的是 github copilot cli 吗
251 天前
回复了 frostming 创建的主题 Python 有一个包管理器叫 PDM,已经四年多了
让我想起了年初看的一篇文章
https://chriswarrick.com/blog/2024/01/15/python-packaging-one-year-later/
加上之前看过的 https://alpopkes.com/posts/python/packaging_tools/
基本介绍了 python 的包管理的复杂生态和一些令人诟病的地方

我觉得官方没有下手也是主要原因, go/rust 这些官方的包管理工具哪个不比 python 的好(手动🐶
@AoEiuV020JP 我看了一下 因为阅读模式确实 他的确没有解析出来一些结果
https://i.imgur.com/veVXBu6.jpeg

这让我确信它确实用到了一些 html 的 parser
但是当你用一个插件 ( https://chromewebstore.google.com/detail/kimi-copilot-%E7%BD%91%E9%A1%B5%E6%80%BB%E7%BB%93%E5%8A%A9%E6%89%8B/icmdpfpmbfijfllafmfogmdabhijlehn)
结果效果相当好
https://i.imgur.com/FQH0xIU.jpeg

但是当你深入问一些详细信息的时候 说明 parser 还是不够好 因为它是读取 html 进去的一些表格信息并没有正确排列
https://i.imgur.com/16JSapK.jpeg

另一个 elmo.chat 它应该是利用了生成的 html 但是详细信息 也是没识别到在乱说
https://i.imgur.com/Zzc5BU2.jpeg
dnd 风格的吗
看起来是 azure 的 tts
其实帖子筛选 不就是文本分类吗 用大模型有点大材小用了,这种你们社区不应该由自己的评分机制吗
比如点踩 访问量等各种指标 来判断优质和低质 有必要几千万的去判断吗?
至于第一个 这个用大模型做一个检索增强生成(RAG) 就可以了 而且是针对用户的 也没那么高请求
255 天前
回复了 xing393939 创建的主题 Python yield 和 return 混用的问题
If the compiler detects the yield keyword anywhere inside a function, that function no longer returns via the return statement. Instead, it immediately returns a lazy "pending list" object called a generator


https://stackoverflow.com/questions/231767/what-does-the-yield-keyword-do-in-python
255 天前
回复了 loyth06 创建的主题 职场话题 关于外包经历的一个疑问
曾经觉得中国人口数量多是一个优势

现在越来越发现 人口数量是一个就业的巨大劣势
是我的错觉吗?
@SayHelloHi 这个不一样好吗 这个是用 metasearch +webarchive 来获取搜索信息的 它等同于搜索引擎
而且需要你部署一个服务 也不是实时的 而且它只获取了网站的 snippet 和 bing/google 这些搜索引擎 API 返回的结果差不多 然而你要获取网站的大纲和详细信息 一定是要用到 html parser 的
官方描述的是 第三方抓取 网页等
```
是否开放类似 Kimi 智能助手中的搜索接口?

目前并没有开放搜索的计划,API 用户可以使用例如 Apify 、Crawlbase 或者 ArchiveBox 等第三方解决方案。
```
但是之前看同类型 elmo.chat 介绍类似的技术方案的时候 html parser 用的是阅读模式
( https://github.com/mozilla/readability)

详情可以看这个技术方案介绍
https://x.com/yadong_xie/status/1774672630194520283
你要想到一个问题 中国人的基数 有白嫖的话 这个成本会很大
而且很容易链式反应 马上就传播了 厂商就要做各种防薅策略哈哈
@Pters 搜了一下并没有机器的网络和 io 有个进程
https://github.com/search?q=repo%3Ajxxghp%2FMoviePilot%20psutil.&type=code
257 天前
回复了 rookiemaster 创建的主题 OpenAI 如何测试 gpt 的版本
可以参考这个 https://nicholas.carlini.com/writing/2024/evaluation_examples/index.html

这上面的问题都很有意思哈哈哈 我第一眼看到的是这个问题
https://nicholas.carlini.com/writing/2024/evaluation_examples/python_to_c_loop_update.html

AI 都是大笨蛋
又是这个法国人, 这个人可以说是计算机科学的神了, 现在开始搞 AI 了是吧
我觉得 你这种是 corner case 多行注释 行内注释呢 不规范注释呢 比如
```python
'''
hello world
'''
# type:ignore



print("hi") #hi
```
应该怎么展示呢 中间有 blank line 呢 还得考虑统一编码风格
讲个笑话 美国地址生成器生成的地址竟然真的能用
黑盒不是很危险吗(老板要是想 code review 咋办)
python 做这种分发的话 我觉得不应该封装一些核心 你认为有价值的逻辑吗 用 c/c++ /rust 等 bind
263 天前
回复了 laters 创建的主题 程序员 有没有什么思路可以实现自动配置开发环境
devcontainer 是最方便的咯 按照你的项目实际需求来
1  2  3  4  5  6  7  8  9  10  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2887 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 12:36 · PVG 20:36 · LAX 04:36 · JFK 07:36
Developed with CodeLauncher
♥ Do have faith in what you're doing.