网上考试系统编制中的随机抽取试题的四种算法

因为教学的需要，我决定编写一个asp+ms sql2000的网上考试系统，其功能主要为：实现判断题、单项多项选择题和填空题的在线自动答题、改卷；并将学生的错误答案记入数据库，供教师分析。在编写从题库中随机抽取试题这一模块的算法上，却颇费了一番周折，现将解决过程记录如下，以供大家参考。

为了便于说明问题，文中提供的代码中的变量pd为从题库中要抽取出来考试的试题数量，数据库表名与字段名我都使用了中文，并仅以判断题为例。

算法一

由于不知道如何实现从题库中随机抽取试题的sql语句，我在网上下载了几个免费的考试系统进行研究，找到了第一种算法，其思路为先将数据库中所有数据读出，获得试题的总数后，生成一个1～（试题的总数－考试的试题数量）之间的随机数，然后从这里开始读出数据：

<% set rs=server.CreateObject("ADODB.RecordSet")

sql="select * from 判断题 order by id asc"

rs.open sql,conn,1,1

mycound=rs.Recordcount'取得试题总数

randomize'初始化随机数种子值

n=fix((mycound-pd+1)*Rnd+1)

rs.move n‘指针移到n这个随机数这个位置

for i=1 to pd

session("pdda")=session("pdda")&rs("正确答案")&"|"‘用session来记录标准答案

‘输出试题及答案%>

<tr>

<tdwidth="10%" ><%=i%>、<%=rs("题目内容")%></td>

</tr>

<% rs.movenext

rs.close%>

这种算法基本上可以实现随机抽取试题，并让每个学生的试题和每一次刷新以后的试题都不相同，但是它的最大不足在于试题的先后顺序总是相同，特别是题库中试题不多的时候，学生几乎可以用背答案方法来应付考试了。虽然可以通过改变数据的排序方式来改变试题的先后顺序，但变化总是不大。

算法二

第二种算法的思路很简单，就是不断生成1～题库中的试题总数之间的随机数，然后到数据库中读取这条记录，直到满足考试的试题量为止。

set rs=server.CreateObject("ADODB.RecordSet")

sql="select * from 判断题 order by id asc"

rs.open sql,conn,1,1

mycound=rs.Recordcount'取得题库中的试题总数

rs.close

for i=1 to pd

randomize

sid=int((mycound +1)*rnd+1)‘生成1～题库中的试题总数之间的随机数

set rs=conn.execute("select * from判断题where id="&sid)

while rs.eof

randomize

sid=int((mycound +1)*rnd+1)

set rs=conn.execute("select * from判断题where id="&sid)‘如果数据库中找不到这条试题，就继续生成随机数读取试题。

wend

session("pdda")=session("pdda")&rs("正确答案")&"|"‘用session来记录标准答案

‘输出试题及答案%>

<tr>

<tdwidth="10%" ><%=i%>、<%=rs("题目内容")%></td>

</tr>

这种算法应该是真正意义上的随机抽取试题，但是遗憾的是如果在题库中题量不多的情况下，很容易会在数据库中读取重复的试题，如果再使用一个变量来储存已经读取过的试题id来解决试题重复的问题，算法就过于繁琐，是很不可取的。

算法二补充：

第二种算法的思路很简单，就是不断生成1～题库中的试题总数之间的随机数，然后到数据库中读取这条记录，直到满足考试的试题量为止。当时我认为这种算法应该是真正意义上的随机抽取试题，但是遗憾的是如果在题库中题量不多的情况下，很容易会在数据库中读取重复的试题，虽然也可以再使用一个变量或数组来储存已经读取过的试题id来解决试题重复的问题，算法就过于繁琐。为此，我片面地认为不可取的。其实用一个变量或数组来储存已经读取过的试题id，在算法上并不繁琐。

写一个生成随机记录的函数

Function rndtest(m_count,r_count) ''参数m_count为试题总数，r_count为要读出的试题数

dim x,st,i

i=0

do while i>=r_count

randomize

x=fix(rnd*m_count)+1 ''产生1~m_count的随机数

if not instr(st,x)>0 then

st=st&x&"," ''用,分割

i=i+1

end if

if i>=m_count then exit do ''如果m_count小于r_count将出现死循环，于是判断并跳出循环

loop

rndtest=st

end function

set rs=server.CreateObject("ADODB.RecordSet")

sql="select * from 判断题 order by id asc"

rs.open sql,conn,1,1

mycound =rndtest(rs.Recordcount, pd) '取得题库中的试题总数

testcound=split(mycound, "'")

for i=0 to UBound(testcound)

rs.absoluteposition=matrix(i) ‘把记录指针移指向第testcound (i)条记录

session("pdda")=session("pdda")&rs("正确答案")&"|" ‘用session来记录标准答案

‘输出试题及答案%>

<tr>

</tr>

算法三

由于第二种算法容易造成试题重复，为了避免系统产生重复的随机数，我试着将题库中试题总数均分为kp个范围，让每个范围个产生一个随机数，这样就有效地避免了随机数重复。

<% set rs=server.CreateObject("ADODB.RecordSet")

sql="select * from 判断题 order by id asc"

rs.open sql,conn,1,1

mycound=rs.Recordcount'取得试题总数

for i=1 to pd

randomize

temp=fix((fix(rs.Recordcount/pd)+1)*rnd+1) ‘生成1～题库试题总数除以试卷试题数之间的随机数

rs.move temp ‘指针移到随机数位置

session("pdda")=session("pdda")&rs("正确答案")&"|"‘用session来记录标准答案

‘输出试题及答案%>

<tr>

<tdwidth="10%" ><%=i%>、<%=rs("题目内容")%></td>

</tr>

<%next

rs.close%>

这种算法能够有效地解决了算法一和算法二的不足，既做到了随机抽取试题，又做到了试题不重复。但是仔细一想还是存在不足：就是题库中的每一道试题出现的概率不相同，这样就显得不科学了。因为kp次都产生大数字的概率是不大了，这样排在后面的试题出现的机会就很小了。

算法四

算法四是我最后的研究结果，其算法分为三步：

Setp1、获取试题库试题总数，然后生成一个1~试题总数的阵列。

Setp2、生成随机数，将这个矩阵打乱。

Setp3、按顺序取出阵列中的题目。

这种算法和洗牌的原理相类似，图示如下：

（设试题库总数为10，要抽取出5道题）

Setp1：

阵列的初始内容如下：

A10

Setp2：

生成两个随机数，如3和6。然后将A3和A6的内容交换，阵列的内容变为：

A10

Setp3、按顺序取出阵列中的题目A1~A5的内容，应该是1、2、6、4、5，读出数据库中相应的试题。

如果不断循环Setp2，该阵列中的内容就随机打乱，这样既实现了随机抽取试题的目的，又避免了试题抽取重复。

dim matrix() '定义变量数组

set rs=server.CreateObject("ADODB.RecordSet")

sql="select * from 判断题order by id asc"

rs.open sql,conn,1,1

mycound=rs.Recordcount'取得试题总数

'设定阵列的初始值

for i=0 to mycound

matrix(i)=i+1

randomize'生成随机数种子

for i=0 to 2*mycound‘循环2*试题总数次

j=fix(rnd*mycound)

k=fix(rnd*mycound)

'交换matrix(k)和matrix(j)的内容

temp=matrix(k)

matrix(k)=matrix(j)

matrix(j)=temp

'取出阵列中的题目，数量为试卷中该类题的数量

for i=1 to pd

rs.absoluteposition=matrix(i) ‘把记录指针移指向第matrix(i)条记录

session("pdda")=session("pdda")&rs("正确答案")&"|"‘用session来记录标准答案

‘输出试题及答案%>

<tr>

<tdwidth="10%" ><%=i%>、<%=rs("题目内容")%></td>

</tr>

<%next

rs.close%>

算法四补充：

当时无法解决定义一个足够大的数组，于是用dim matrix(X)，预设一个足够大的数字X。虽然说暂时不会出现问题，但是如果数据库中的试题数很大呢？总像一块石头搁在心中。呵呵。现在发现了ReDim语句，vbs参考中是这样介绍ReDim 语句的：在过程级中声明动态数组变量并分配或重新分配存储空间。这样用ReDim matrix (rst.Recordcount)就可以完美地解决了这个问题。

Dim matrix()

set rs=server.CreateObject("ADODB.RecordSet")

sql="select * from 判断题order by id asc"

rs.open sql,conn,1,1

mycound=rs.Recordcount '取得试题总数

ReDim matrix(rst.Recordcount) ‘定义一个等于rst.Recordcount的数组

'设定阵列的初始值

for i=0 to mycound

matrix(i)=i+1

randomize '生成随机数种子

for i=0 to 2*mycound ‘循环2*试题总数次

j=fix(rnd*mycound)

k=fix(rnd*mycound)

'交换matrix(k)和matrix(j)的内容

temp=matrix(k)

matrix(k)=matrix(j)

matrix(j)=temp

'取出阵列中的题目，数量为试卷中该类题的数量

for i=1 to pd

rs.absoluteposition=matrix(i) ‘把记录指针移指向第matrix(i)条记录

session("pdda")=session("pdda")&rs("正确答案")&"|" ‘用session来记录标准答案

‘输出试题及答案%>

<tr>

</tr>

<%next

rs.close%>

总结：

相对来说，算法四应该是最合理的。但是我不知道应该循环Setp2多少次，阵列中的数值最“随机”，而且我不知道当试题库的试题总数很多的情况下，这种算法是否会很占系统资源，欢迎大家来信和我讨论。