V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
grimpil
V2EX  ›  问与答

用大模型来生成的随机数,这算是真随机还是伪随机?

  •  
  •   grimpil · 147 天前 · 1293 次点击
    这是一个创建于 147 天前的主题,其中的信息可能已经有所发展或是发生改变。

    你是一个随机数生成器,请生成一个 100 位的 16 进制数字

    好的,这里是一个 100 位的 16 进制数字: 4A8B9C7D3E5F6A1B2C3D4E5F6A7B8C9D0E1F2A3B4C5D6E7F8A9B0C1D2E3F4A5B6C7D8E9F0A1B2C3D4E5F6A7B8C9D0E1F2A3B4C5D6E7F8A9B0C1D2E3F4A5B6C7D8E9

    按照大模型的工作原理,这个数字应该无法预测、无法重复吧,简单测试了一下(生成 50 组 x40 位,共 2000 位),统计结果也算均匀分布,是不是这就能叫真随机了?

    10 条回复    2024-06-22 12:15:15 +08:00
    sentinelK
        1
    sentinelK  
       147 天前
    你这个 100 位的 16 进制条码,一共有多少种组合?你测了 2000 次就“均匀分布”、“无法重复”了?
    sriram
        2
    sriram  
       147 天前
    有个参数 seed
    grimpil
        3
    grimpil  
    OP
       147 天前
    @sentinelK 这一点我确实不太懂啊,所以有个想法来探讨一下,大数的话是否随机分布一般怎么统计呢?
    Donaldo
        4
    Donaldo  
       147 天前
    个人看法:大模型的随机性是靠推理时候引入的(伪)随机性来产生的。如果这样能产生真随机,那是不是前后矛盾了。
    artiga033
        5
    artiga033  
       147 天前 via Android
    你这个模型是本地部署的吗,如果是那只要所有参数一致它连回答的话都一字不差,类比成绘图模型可以根据参数 100%复现,只不过语言模型没这个必要所以不常见,云服务一般也都把一些噪声参数隐藏掉了
    pkoukk
        6
    pkoukk  
       147 天前
    GPT 模型参数里有 seed ,固定相同的 seed ,有大概率可以复现你的结果。所以不算无法重复
    passive
        7
    passive  
       147 天前 via Android
    你这串字母数字必定相间的排列,随哪儿的机了?
    Greendays
        8
    Greendays  
       147 天前
    前几天才看到一个文章说 cloudflare 怎么实现真随机的,基本都要用到现实世界中的参数。比如对着一堆反光片拍照,这些反光片会随风摆动,每次拍出的照片是不一样的,以此生成哈希值,再生成随机数。
    deplives
        9
    deplives  
       147 天前 via iPhone
    你再仔细看看你这个数字是随机的么?规律性这么强
    airchaoz
        10
    airchaoz  
       147 天前
    程序内部是无法产生随机数的,所有真随机都需要从物理世界中获取,真随机数是上帝掷骰子掷出来的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2847 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 06:40 · PVG 14:40 · LAX 22:40 · JFK 01:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.