找回密码
 立即注册
搜索
楼主: NaCN

[求助] 一道概率题,供诸位提神醒脑

[复制链接]
     
发表于 2024-10-16 12:06 来自手机 | 显示全部楼层
我觉得和n的值有关,当n为无穷时。可以认为每次摸出的都是白球。红球数应为零。
回复

使用道具 举报

     
发表于 2024-10-16 12:08 来自手机 | 显示全部楼层
第一行n趋近于无限

—— 来自 鹅球 v3.2.91
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-10-16 12:14 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

 楼主| 发表于 2024-10-16 13:44 | 显示全部楼层
这道概率计算来自于我实际工作中遇到的问题,一个结构对称的化合物W-X-W,两端有相同的基团W(White)可以和保护试剂P反应转化为基团R(Red)。自然地,有以下反应:
W-X-W + P → W-X-R (单保护产物)
W-X-R + P → R-X-R (双保护产物)
R-X-R + P → 不反应
我想知道什么条件下能以最大收率获得单保护产物W-X-R。实际操作时还涉及到原料和单保护产物中W的反应活性、活化能Ea、反应速率常数k、反应物浓度,最后应该列出单保护产物浓度是时间t的函数f(t),再对f(t)求导。
因为过于复杂,我在这里全部简化,假设每次只有一个分子P加入到原料溶液中,原料和单保护产物的活性相同,马上能和P反应,不用考虑时间t的因素。那么当使用多少量的P才能让W-X-R的产率最高呢?
于是上述案例转化成白球涂色,对于n个白球(n个原料W-X-W分子),随机摸出一个球涂色(和试剂分子P碰撞反应),只有白球(原料)和半红半白球(单保护产物)可以涂色(反应),而红球(双保护产物)不再涂色直接放回(即使和分子P碰撞也不反应)。

易知,白球的比例期望值随涂色次数增加单调递减,半红半白球比例先增后减,红球比例单调递增,当涂色2n次后全部都是红球比例为1。那么是不是涂色n次能使半红半白球比例最高呢?因为实际反应中一般为了高产率获得单保护产物,原料和试剂P的投料比例为1:1到1:1.2。可实际模拟下来n个白球涂色n次似乎不是最优解。

最后,回答有些网友的一个问题:n到底是无穷大还是一个数?
实际反应中原料为mmol级别,也就是1e20数量级,有一个明确的数字。题干里写成无穷大是为了可以写成极限,程序模拟下来1e6的数量级已经可以得到准确的数值解。
回复

使用道具 举报

     
发表于 2024-10-16 14:20 | 显示全部楼层
本帖最后由 xmmc1800 于 2024-10-16 14:21 编辑

非常有意思的一道题,虽然我也没能力推出精确解的通项公式,但看了下目前楼里包括31楼在内的答案应该都是错的,

对于总共n个球的情况,记涂色k次后恰有r个红球的概率为p(k, r),此时半红半白球数量为(k-2*r),白球数量为(n-k+r)
考虑(k, r)状态的来源:
1. (k-1, r-1)状态下,一个半红半白球被涂成红球,其概率为(半红半白球数量)/(白球数量+半红半白球数量), 即(k-2*r+1)/(n-r+1)
2. (k-1, r)状态下,一个白球被涂成半红半白球,其概率为(白球)/(白球数量+半红半白球数量), 即(n-k+r+1)/(n-r)
因此有递推关系式
p(k, r) = p(k-1, r-1) * (k-2*r+1) / (n-r+1) + p(k-1, r) * (n-k+r+1) / (n-r)
初始条件为p(0, 0)=1, p(0, _)=0

涂色k次后半红半白球比例期望为 sum(p(k, r) * (k-2*r), r=0..floor(k/2))

这样相当于得到了一个复杂度O(n^2)的求精确解算法,但是要从这个递推式得到通项公式目前还没什么头绪

附上第一问半红半白球比例期望在n=1到10的精确解和近似值,可以用来验证其他算法
[(1, 1.00000000000000, 1),
(2, 0.500000000000000, 1/2),
(3, 0.481481481481481, 13/27),
(4, 0.442708333333333, 85/192),
(5, 0.427760000000000, 5347/12500),
(6, 0.416181069958848, 25283/60750),
(7, 0.408539313492862, 227103542/555891525),
(8, 0.402756963171145, 159703961489/396526878720),
(9, 0.398338563958694, 337267530400363/846685610975232),
(10, 0.394822990291931, 575760142406566849/1458274104000000000)]

至于第二问,我跑了下n在1000以下时最大次数基本都是0.8964*n取整,但有时会有±1的误差,n更大的情况目前还没验证过,但我猜依然会保持一个近似线性的关系

评分

参与人数 2战斗力 +2 收起 理由
NaCN + 1 好评加鹅
兔耳僵尸 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2024-10-16 14:29 来自手机 | 显示全部楼层
NaCN 发表于 2024-10-16 13:44
这道概率计算来自于我实际工作中遇到的问题,一个结构对称的化合物W-X-W,两端有相同的基团W(White)可以 ...

你这简化就很有问题,反应动力学哪能简化成这么简单的模型,什么平衡条件都不考虑的 明明有成熟的理论为什么还要这么费事,不理解
回复

使用道具 举报

     
发表于 2024-10-16 15:55 | 显示全部楼层
NaCN 发表于 2024-10-16 13:44
这道概率计算来自于我实际工作中遇到的问题,一个结构对称的化合物W-X-W,两端有相同的基团W(White)可以 ...

还是想的太多,过柱子去吧
回复

使用道具 举报

     
发表于 2024-10-16 17:29 来自手机 | 显示全部楼层
一下推导非常不严谨,甚至可能是错的
n为无穷大的时候,不妨设所有球的集合是一个长度为1的线段。设白球集合的大小(长度)为y,半红半白为z。每次取球涂色本来是一个随机的离散动作,这里变成取一段极小的dl,由于随机,可以认为dl里面y/1的比例是白球,z/1的比例是半红半白。原本要求的涂色次数变成dl里面白色和半红半白的总和长度,记为dx

每次y/(z+y)部分的dx都会被从白色转移到半红半白,而z/(z+y)部分的dx从半红半白变为全红

所以有
dz/dx=(y-z)/(y+z)
dy/dx=-y/(y+z)
解这个方程,最后大概这样

第一问是当x=1时,这边用Wolfman alpha大概是0.364311
第二问求导,居然能解出来,是2-3/e约为0.89636的时候取极值

评分

参与人数 2战斗力 +3 收起 理由
NaCN + 1 好评加鹅
xmmc1800 + 2 好思路!

查看全部评分

回复

使用道具 举报

     
发表于 2024-10-16 20:14 | 显示全部楼层
兔耳僵尸 发表于 2024-10-16 17:29
一下推导非常不严谨,甚至可能是错的
n为无穷大的时候,不妨设所有球的集合是一个长度为1的线段。设白球集 ...

方程左边物理意义不是很明确,不如直接不妨将球按照颜色排序,并使每次取dl时取出的三种颜色的球的比例等于全体三种颜色的球的比例

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2024-10-16 22:26 | 显示全部楼层
兔耳僵尸 发表于 2024-10-16 17:29
一下推导非常不严谨,甚至可能是错的
n为无穷大的时候,不妨设所有球的集合是一个长度为1的线段。设白球集 ...

好思路!相当于不考虑每个状态的概率,直接从整体期望的角度做递推,然后再把递推方程改写成微分方程
对于总共n个球的情况,记涂色k次后红球比例的期望为r(k),白球比例的期望为w(k),半红半白球比例的期望为h(k),则有
① r(k)+w(k)+h(k)=1
② 2*r(k)+h(k)=k/n
③ r(k)=r(k-1)+h(k-1)/(w(k-1)+h(k-1))
①②代入③可消去w与h,只保留r的递推式
r(k) = r(k-1)+2-(2-(k-1)/n)/(1-r(k-1)), r(0)=0

按这个递推求解,时间复杂度就只有O(n)了,再改写成微分方程的形式,甚至可以得到某种程度上的解析解
r'(t) = 2 - (2 - t )/(1 - r(t)), r(0) = 0
Mathematica求解得 1 + r(t) - t = exp(2 + (-2 + t)/(1 - t + r(t))),这个方程没有初等形式的解析解,但可以用来做推导,一通求导+代入后得到
t=2-3/e时刻半红半白比例期望最大,最大值刚好是1/e

但是里面有个小问题,③式在离散条件下其实并不成立,解出来的期望和精确解存在一定误差,不过试了下发现这个误差会随着n的增加而减小,n=1e6时量级就到1e-7以下了,对n->+∞的情况精度应该是足够了,但这个我也没想明白怎么证明

n
精确解
简化解
误差
100
0.36727438
0.36629398
9.8040E-04
500
0.36490225
0.36470600
1.9625E-04
1000
0.36460660
0.36450846
9.8135E-05
5000
0.36437021
0.36435058
1.9629E-05
10000
0.36434067
0.36433086
9.8145E-06
50000
0.36431704
0.36431508
1.9629E-06
100000
0.36431409
0.36431311
9.8146E-07
500000
0.36431172
0.36431153
1.9629E-07
1000000
0.36431143
0.36431133
9.8146E-08


评分

参与人数 1战斗力 +1 收起 理由
NaCN + 1 好评加鹅

查看全部评分

回复

使用道具 举报

 楼主| 发表于 2024-10-16 23:10 | 显示全部楼层
mmbk 发表于 2024-10-16 14:29
你这简化就很有问题,反应动力学哪能简化成这么简单的模型,什么平衡条件都不考虑的 明明有成熟的理论为 ...

因为成熟的理论得不出想要的答案。我推导过连续二级反应的动态平衡,但是需要知道k1、k2等才有数值解,所以考虑了上述简化模型。简化后的模型依然难以计算,却是很有意思的概率题,所以发出来供大家讨论。
回复

使用道具 举报

 楼主| 发表于 2024-10-16 23:11 | 显示全部楼层
kiritokun 发表于 2024-10-16 15:55
还是想的太多,过柱子去吧

难过,极性溶解度导致三者大量交叉。正是因为分离过才会思考如何从根源上优化。
回复

使用道具 举报

     
发表于 2024-10-17 02:27 来自手机 | 显示全部楼层
你表述太复杂了 应该说有n个盒子 随机放入一些球 然后用球的数量去表述 而不是涂色

—— 來自 Sony XQ-DQ72, Android 14上的 S1Next-鵝版 v2.5.4
回复

使用道具 举报

     
发表于 2024-10-17 03:18 来自手机 | 显示全部楼层
本帖最后由 mmbk 于 2024-10-17 03:27 编辑
NaCN 发表于 2024-10-16 23:10
因为成熟的理论得不出想要的答案。我推导过连续二级反应的动态平衡,但是需要知道k1、k2等才有数值解,所 ...

你想建模那知道速率常数难道不是最最最基础的吗?有时间做这种模型不找个做物化的去测一下吗,不行自己取几个点打下核磁。再不济分类讨论总会吧,本科物化里各种稳态近似啥的难道都有速率常数数值吗。再再再不济带几个估计值算一下找规律总会吧?

何况单保护怎么做文献里多了去了,与其搞这么抽象的模型不如多查查文献改进下方案。我一个不做化学的靠勒夏特列原理都能知道应该加大于等于1 eq.,如果这点都要质疑先把物化课本多翻翻再说

再何况你考虑速率方程有啥意义呢,我看这大概也不是什么位阻很大动力学因素很明显的情况,假设平衡条件不是足够了?而且你考虑微观反应动力学很明显可以得出K1约等于4K2,这个假设甚至可以让你用解一元二次方程的方式笔算平衡方程。把解析解告诉你,应该投保护剂(1+1/(c0K2)) eq.,这里c0是初始物料浓度。可以自己算一遍作为练习

思而不学则殆只能说。你投料毫摩尔级那也大概率不是在厂里上班,要是组会上讲个这玩意很难不被老板劈头盖脸一顿骂本科物化怎么学的
回复

使用道具 举报

     
发表于 2024-10-17 08:03 | 显示全部楼层
试着把问题拆成若干个小问题?
回复

使用道具 举报

     
发表于 2024-10-17 12:56 | 显示全部楼层
本帖最后由 fuochai 于 2024-10-17 12:59 编辑
fuochai 发表于 2024-10-17 02:27
你表述太复杂了 应该说有n个盒子 随机放入一些球 然后用球的数量去表述 而不是涂色

—— 來自 Sony XQ-DQ7 ...

想到了 直接用一个矩阵表示所有的状态对应的期望 第一位是白球数(即空盒子) 第二位是半红半白 (即1个球的盒子)每一行对应一个状态 初始期望矩阵是(1,0;0,0;...) 然后每次操作时对上个期望矩阵的操作是依据所在位置的加权求和 把状态矩阵拉成向量的话每一步都是一个矩阵乘法 所以操作n次就是这个矩阵乘法进行n次 如果有jordan标准型就直接可以化简了 没有的话矩阵分析应该有办法近似一下 但不管怎么说 那个矩阵乘法对e1单位向量作用n次就是解析解了 这个矩阵是可以写出来的 但是我懒得写了

其实解析解没那么好表示的 尤其是排列组合 可能生出非常复杂的东西 我之前尝试算某个概率会递增的抽卡手游的期望就是用这种方法 Jordan标准型是没有的 只能算算近似值了
但这种近似是直接再算期望 比你模拟个一百次一万次好得多 因为它相当是同时再算所有情况的期望
回复

使用道具 举报

     
发表于 2024-10-17 14:47 | 显示全部楼层
xmmc1800 发表于 2024-10-16 22:26
好思路!相当于不考虑每个状态的概率,直接从整体期望的角度做递推,然后再把递推方程改写成微分方程
对 ...

你之前那个递推公式用RSolve解不出吗?
回复

使用道具 举报

发表于 2024-10-17 15:26 | 显示全部楼层
本帖最后由 btnooni 于 2024-10-17 15:38 编辑

第一问n个球涂色n次是个很苛刻的条件概率吧,搭配红球半色球和最多涂两次的规则:
设红球个数为x,涂两次消耗2x次数,则半色球个数=涂一次的次数=涂n次-涂两次的次数=n-2x,而白球个数=n-红球个数x-半色球个数(n-2x)=x
不管半色球怎么取,红球和白球的数量居然都是相等的???题设条件是怎么搞出这种对称性的?????我很好奇
同时这么一看题设条件的场景已经不是每种排列都能满足的了,当n取5的时候红色球=白色球的取值实际只有0,1,2三大类情况。
计算条件概率得把满足条件的所有场景算出来。情况可分为最基础的摸n次涂n次和摸n+m次涂n次中多的m次两种。第一种是没有摸出过红球的情况,并且具备了所有可能的球排列。第二种不会改变其基础排列,而多出的m次都是在反复摸红球。
设n为偶数时是2a,奇数时为2a+1,则红球白球最大能取到a,下面以偶数为例。
根据前面的题设推导,设红球=白球=x个,半色球为2a-2x。
单个基础排列组合可能个数为从2a球中挑2a-2x个半色球乘以从剩余2x球中挑x个红球f(x)=C(2a,2a-2x)*C(2x,x)。基础排列每单个组合发生概率相同,第二种排列则在此概率上稀释,最后一步除法其实上下约去了一个总体的概率,不想搞太复杂直接不写了。
当m=1时,可视为从基础排列的概率上再乘以从2a球中选中红球的概率x/2a。m=2则是在m=1的概率之上再乘上x/2a。。。。。。
则每个基础排列和及其衍生的概率乘积之和为f(x)*(1+x/2a+(x/2a)^2.........),后面是等比数列求和,由于m趋向于无穷求和公示可化简为f(x)*1/(1-x/2a)=f(x)*2a/(2a-x)
所有符合题设的可能排列为①求和x从0取到a的所有f(x)*2a/(2a-x)之和。
在这些排列中半色球占的等效排列数为②求和x从0取到a的所有f(x)*2a/(2a-x)*半色球比总球数(2a-2x)/2a=f(x)*(2a-2x)/(2a-x)之和。
最后半色球的比例期望为②/①。

用wolfram alpha算了下n=30的情况,得到的期望是0.3333....,趋近于1/3。

几十年没碰过概率+渣文案shi一样的可读性,有错轻喷
回复

使用道具 举报

 楼主| 发表于 2024-10-18 01:53 | 显示全部楼层
fuochai 发表于 2024-10-17 12:56
想到了 直接用一个矩阵表示所有的状态对应的期望 第一位是白球数(即空盒子) 第二位是半红半白 (即1个球 ...

感谢您的回答

关于题目描述,我在44楼讲了背景,您的表述和我的表述本质上等价。

解这道题试图分析每种状态会带来巨大的计算量,我自己就卡在了计算上。我数学能力一般,您提出的矩阵分析和Jordan标准型我都没学过。个人认为48楼和50楼的思路从整体比例期望着手,对数学运算的要求较低,最后也得出了比较满意的结果。
回复

使用道具 举报

 楼主| 发表于 2024-10-18 02:00 | 显示全部楼层
btnooni 发表于 2024-10-17 15:26
第一问n个球涂色n次是个很苛刻的条件概率吧,搭配红球半色球和最多涂两次的规则:
设红球个数为x,涂两次消 ...

感谢回答

过程我还没时间细看,但结果应该有问题,45楼和50楼给出了几个不同n值的精确解,都大于1/3。
回复

使用道具 举报

     
发表于 2024-10-18 08:17 | 显示全部楼层
如果是实验问题,我还是建议实验方法解决,多做几个不同比例的小剂量反应,打核磁/hplc直接看结果比较方便
回复

使用道具 举报

     
发表于 2024-10-18 12:09 | 显示全部楼层
这不是很简单吗,考虑单个球不就是二项分布吗


—— 来自 S1Fun

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2024-10-18 21:02 | 显示全部楼层
NaCN 发表于 2024-10-18 01:53
感谢您的回答

关于题目描述,我在44楼讲了背景,您的表述和我的表述本质上等价。

楼主发文章会ref这个帖子吗
回复

使用道具 举报

发表于 2024-10-18 21:45 | 显示全部楼层
本帖最后由 btnooni 于 2024-10-18 22:20 编辑
NaCN 发表于 2024-10-18 02:00
感谢回答

过程我还没时间细看,但结果应该有问题,45楼和50楼给出了几个不同n值的精确解,都大于1/3。 ...

嗯,我这边有些式子写错了。不过45楼的推导里感觉忽略掉了红球稀释给其他球的概率,(k,r)的状态来源也可以是(k,r)。
回复

使用道具 举报

 楼主| 发表于 2024-10-18 23:37 | 显示全部楼层
fuochai 发表于 2024-10-18 21:02
楼主发文章会ref这个帖子吗

让您见笑。发文章什么是想多了,简化成概率题的模型已经不能对现实起到指导作用。更复杂的连续二级反应动力学早在1987年就已发表于 Can. J. Chem. 1987, 65 (8), 1987–1994,讨论了白球可以涂色m次时,涂色k次球的比例随时间的变化。不过需要知道许多参数,最后求得的也是数值解。

之所以我要求解析解,是因为我在程序模拟的时候发现了第一问的答案逼近1/e,但我的数学能力不足以推导出这个结果,而第二问也不是我猜测的1:1时能取得最大值。翻遍互联网问过AI都未果的问题拿来论坛分享两天就有坛友给出解答,第二问还给出了漂亮的2-3/e这个解,让我感受到了数学的美妙。

回到您的问题,假设能够发表,我会列出此贴网址,邀请48楼兔耳僵尸和50楼xmmc1800为共同作者。(现实里谁在乎你的概率题啊,产率低多投料多分离去!
回复

使用道具 举报

     
发表于 2024-10-19 11:35 来自手机 | 显示全部楼层
本帖最后由 love4aids 于 2024-10-19 12:03 编辑

问了下GPTO1

来自: iPhone客户端

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-31 12:47 , Processed in 0.123789 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表