2009-05-22 10:55:56 来源:计算机世界报
问卷调查是现代社会掌握舆情态势、了解消费意愿的重要手段,而SPSS是一种广泛使用的统计分析工具。随着“在线问卷调查”的广泛应用,人们希望能将“在线问卷调查”和SPSS这种强大的统计分析软件结合起来,以更加高效地完成统计分析工作。从软件工程的角度来说,也就是要开发出SPSS数据规范型在线问卷调查系统即让调查问卷的数据格式符合SPSS数据定义,从而通过Web平台自动完成舆情数据的采集、转化并生成SPSS数据库,进而改变舆情研究部门的低效状态,以大幅度提升整个社会的舆情信息研究质量。
项目的设计思路
与模块规划
根据我国用户的网络使用习惯,要将SPSS统计分析软件包引入大中型在线舆情调查,要重点考虑一般文本条件下的问卷处理子系统和在线调查网站平台子系统两组模块的建构。
就问卷处理子系统而言,基本设计思路是问卷编辑器要基于常规的文本处理软件,不仅实现问卷变量同SPSS数据规范的可靠对接,同时还提供编制大中型问卷所需的各种操作。这组模块运行在Windows操作系统环境中,其功能设计重点关注以下几点:
1. 它有一个能编制大中型调查问卷的电子问卷模版,用户依托它可以像处理普通文档一样创建新问卷、设置或修改问卷的相关基本信息。
2. 用户可以在预设的电子问卷中添加和设置不限数量的单选题、多选题、各种单选矩阵、排序题及主观题等,所有题型的题目都可以对其进行编辑。
3. 用户可编辑每道题目的SPSS变量数据关联信息。单选题每个题目对应一个SPSS变量,多选题题目中每个选项对应一个SPSS变量,用户可根据需要编辑所有的SPSS变量参数。
4. 用户可以设置创建包含若干题目的分区,按照需求对不同类别的调查题目进行架构组织调整,还可以选用描述性信息对分区特性做出说明并在调查页面中加以显示。
5. 问卷编辑器能以特定格式将问卷信息存放在一个文档中,供日后发布调查项目时调用。用户还可以选择对问卷进行加密处理,以增强文本的安全性。
而在线网站子系统的设计方面,主要考虑这组模块应能够接受用户上传的含有SPSS数据规范信息的大中型电子文本问卷,并较为便捷地将其转化成网页页面,还要支持多个问卷同时开展在线调查数据采集,获得舆情数据后能自动生成SPSS数据库文件供用户下载分析。
由于在线调查通常与社会事务决策和企业管理决策密切关联,SPSS数据规范型在线问卷调查系统的安全管理和稳定运行同样重要。因此,该子系统的模块设计特别强调拥有可靠的调查管理、问卷管理及用户管理等平台管理功能,确保只有拥有特定权限的用户能够在调研平台上进行操作。该子系统还能够限定问卷可接受的样本规模,并仅向合法用户提供数据下载等必要的在线服务。模块还能记录IP地址等有关的特征信息,防止一台计算机同时登录两个被调查者。
项目的开发难点
符合SPSS数据规范的大中型在线问卷调查系统要真正适用,有一系列难点需解决。其中,有关问卷文档的存储处理、调查数据的暂存处理、在线问卷调查页面处理以及调查数据转化处理等四个问题需要特别关注。
对于问卷文档的格式设计,人们期待的是一个高度自动化的系统,它不但能保存问卷文本、保存相关的SPSS数据定义以及数据定义与问卷题目之间的关联信息,而且能够将所有文本与数据定义正确解析出来。其中,文件的格式以及系统对文件的访问方式具有决定性的影响。本设计采取基于XML技术的问卷文档格式。
在线数据的暂存处理要着眼于控制开发成本和降低开发难度,设计以商用数据库(如Oracle、SQL Server)作为数据中转点,待填写问卷结束后系统再对暂存的数据进行符合SPSS规范的转化。由于在线调查的不同问卷所包含的题目数量各不相同,故问卷所包含的SPSS变量数量也不确定,这意味着调查系统无法按照一个统一的数据库表结构进行数据存储。为此选择为每一个问卷在数据库中创建一个数据表,数据表的键要与问卷所包含的SPSS变量名一一对应,以有效防止可能出现的数据表键名定义冲突。此外,由于SPSS和商用数据库的数据类型差异较大,在暂存数据库中存储的数据可考虑转化为字符串形式进行存储。
在在线问卷的调查页面处理方面,由于大中型在线问卷调查的页面是动态的,其调查页面使用ASP.NET技术实现。为了避免系统为每个调查问卷均生成HTML页面文件导致系统存储空间被大量占用,同时防止SPSS变量信息泄漏,问卷的页面转化、呈现、数据采集等工作可以通过开发相应的服务器控件完成。这样,不同的调查可通过向同一个页面中的服务器控件传递不同参数的机制实现区分和引导。为此,专门设计了问卷访问接口和数据库访问接口。问卷访问接口用于读取并解析指定问卷中的XML格式题目与SPSS变量信息,并传递给服务器控件进行呈现与数据采集。服务器控件在采集到被调查者填写的信息后,将一组或若干组SPSS变量相关的数据集合传送给数据库访问接口。数据库访问接口接收到数据后,将每一个SPSS变量对应的数据存储在指定的暂存数据库表中相应行位置的同名键位置处。这种问卷调查页面不仅能够读取各不相同的问卷并将之显示于被调查用户的浏览器中,而且还能根据同样各不相同的SPSS数据定义进行数据的获取和存储。
调查数据的转化处理就是将商用数据库中的数据转化为SPSS数据库文件,可以考虑采用基于SPSS开放的spssio32.dll进行。NET环境下封装的方法加以实现。Spssio32.dll封装了对SPSS文档(*.sav)进行访问的一些基本操作,相关程序涉及的函数数量很多,操作的逻辑动作相当细微,可根据需要对之进行整合与组装,这相当于创建了一个精巧方便、可以脱离SPSS软件环境操纵SPSS数据的文件驱动。在大中型在线问卷调查平台上,它可以被当做一个普通的程序模块而不是一个完整程序实例调用。
链 接
SPSS数据库的组成
一个完整的SPSS数据库(*.sav文件)由数据集合与变量集合两部分组成。数据集合包含若干数据样本条目,而变量集合则定义和限制了数据集合的结构与数据的属性。数据集合中每一个数据样本均由一组属性对应相应的变量组成,同一个数据库文件中所有数据样本的结构相同。
变量集合则集中定义和维护数据库变量的属性。SPSS数据库中的变量概念和商用数据库中的键的概念类似,但因SPSS数据库面向数理统计分析,其资料格式与商用数据库存在较大差异。因此,其数据无法直接用于商用数据库中,这是一般网络调查数据无法直接用于SPSS的主要原因。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。