您现在的位置:重庆市教育评估院>>监测与信息中心>>监测技术

    国际学生评估项目研究(PISA)理论介绍

    编辑:作者:方张松 审核: 来源:文章来源:方红峰(教育厅基础教育处) 发布时间:2011-03-14 浏览次数:

    为生存而学习
     
    ――国际学生评价计划(PISA)简介
     
     
     
     
    浙江省教育厅基础教育处
    ΟΟ九年二月
    前言
     
    经济合作与发展组织OECD为迎接知识社会的到来,确定了要把欧洲建设成“世界上最富竞争活力的知识经济体,并实现经济可持续发展”的战略目标,为此,需从适应知识社会要求出发对欧盟教育与培训体制进行改革。1997年至2002OECD实施了名为《能力的界定与遴选:理论框架与概念基础(DeSeCo)》大规模的跨国研究计划,梳理出八个领域的“成功人生和良好运转的社会”所需的关键能力,这些关键能力是“公民成功地适应迅速变化的世界所必须的、中小学能给予初步培养的新的知识和技能”。同时,OECD2000年开始进行国际学生评价项目(PISA),目的是通过一套能够测量教育结果的国际教育质量指标和对各国学生进行抽样测试所取得的结果,来描述各个国家的教育质量(关键能力)水平。
    国际学生评价项目(PISA)与其他国际性评价,如国际科学与数学调查趋势(TIMSS)只关注“学校”的知识、主要考察学生对学校课程的学习情况,有着显著的不同。第一,主要关注学生是否准备好去应对未来的挑战,他们是否具有有效地分析、推理与交流自己的思想观点及终身学习的能力;第二,强调通过在真实生活情景中,考查学生运用知识和思维能力的表现,来反映学生掌握关键能力的状态;第三,通过搜集各国学校教育、家庭、社会等方面的背景信息,运用评价框架对测试所取得的结果进行详细的解释,为各个国家和地区制定更加行之有效的教育政策提供依据。
     
     
     
     
     
     
     
     
    目 录
     
     
     
     
     
     
     
     
    为生存而学习
    ――国际学生评价计划(PISA)简介
    基教处 方红峰
    一、国际学生评价计划(PISA)概况
    国际学生评价项目PISA Programme for International Student Assessment经济合作与发展组织OECDOrganization for Economic Cooperation and Development成员国的合作项目,也是目前世界上最有影响力的国际学生学习评价项目之一,其目的在于测量义务教育即将结束时,年青人(15)为走向社会而准备的知识和能力情况。
    PISA以纸笔测验的形式测量学生的阅读能力、数学能力和科学能力,从而了解学生是否具备未来生活所需的知识和技能,同时学生还需完成一份关于他们的背景和态度的调查表。PISA三年测试一次,每次以一方面能力为主(2/3),其他两个方面能力为辅(1/3)。2000年重点考察阅读能力,2003年的重点是数学能力,2006年则为科学能力,2009年开始第二个循环。另外,PISA2003年还增加了问题解决能力的测试。
    PISA是由OECD成员国发起并参与的,同时也吸纳其他非成员国和地区参加,中国香港、中国澳门、中国台北都已参加,中国上海计划于2009年参加。参加PISA测试的国家和地区,2000年有43个,2003年为41个,2006年有58个,每个国家或地区参与的学生人数在4500人到10000人之间。PISA2000年、20032006年三次测试之后,其新颖、规范、科学的设计与严格的控制标准,引起了世界范围的广泛关注和强烈反响。PISA现在已发展成国际上最有影响力的学业评价,参与的国家和地区的GDP总量占全世界的86%
    二、国际学生评价计划(PISA)发展的背景
    经济合作与发展组织OECD是一个全球性的国际组织,在经济、社会、环境、教育、公共政策等多个领域的研究,已经成为许多国家政府制定发展政策必不可少的参考。随着知识经济时代的到来,各国都需要制定国家长远的发展规划,其中十分重要的是教育发展战略,这十分需要有关对教育人力和财力的投资回报等方面可比性的信息资料。然而,迄今为止的国际测试都是关注学生对其国家某部分的公共课程掌握情况――这是一种有效但却具有局限性的成绩衡量方法,而适应各国的对教育结果进行等效和可靠的测量方法则十分缺乏。为此,1997 2002OECD实施了大规模的跨国研究计划,这个计划名称为《能力的界定与遴选:理论框架与概念基础.Definition and Selection of Competencies: Theoretical and Conceptual Foundations,简称DeSeCo)》。该计划由瑞士联邦统计办公室主持,并与美国教育部国家教育统计中心及加拿大统计局合作进行。在DeSeCo基础上,发展了国际学生评价计划(PISA)。
    PISA是一个合作过程,汇集了来自30多个国家和地区的世界一流水平的学术专家,在利益共享的基础上,通过OECD各成员国政府对PISA共同给予指导,合作制定了一种在不同国家和文化背景下都有可比性的、有效测量相关技能和以真实人生状况为基础的评价学生的方法。
    PISA 的目的是通过一套能够测量教育结果的国际教育质量指标和对各国学生进行抽样测试所取得的结果,来描述各个国家的教育质量水平。PISA测评试图反映:(1)学校教学努力的方向和课程的优势和劣势,是否可以使学生的学习更有效?(2)什么样的教育体制和教学实践能最大限度地提高不利背景的学生的学习效果?(3)学校资源的质量在多大程度上影响学生的学习效果?……等等。更重要的是,它对广泛的测试数据进行系统分析,找出这一阶段各国学生学习能力变化的特点,以及造成这些变化的社会、经济及政策原因,从而为各个国家和地区制定更加行之有效的教育政策提供依据。
    三、国际学生评价计划(PISA)的关键能力框架
    毫无疑问,建立一套能在不同国家和文化背景下都有可比性的评价指标是一项非常艰巨的工作,主要是因为真正的教育“成果”是不能简单地跨国度来测量的。我们可以研究人们在教育上花了多少时间,或是看有多少学生通过了有可比性的级别考试。但是因为这些测试在各个国家是不同的,所以不能真正比较每一个教育系统的状况。尤其是在考虑各国的文化方式时,则更为困难,如日本学校培养出的以一种方式思考的成年人,也许是适合日本社会的;瑞士学生的思维方式可能是适应瑞士社会的,谁能说哪一个“更好”呢?为克服以往教育对学生评价的不足与缺陷,满足社会发展对人力资本的质量监控要求,DeSeCo从一个全新的角度展开了对人力资本的测量与评价,即评价学生现实生活和终身学习所必须的知识和技能。
    (一)聚焦关键能力
    DeSeCo认为必须基于终身学习的动态模型来设计评价指标。这是因为中小学教育并不能提供人生发展所必需的全部能力:能力在人的一生中不断发展和改变,随着年龄的增长个人可能获取或失去部分能力;由于技术进步和社会结构与经济结构的转变,个人的要求在整个一生中是会不断变化的;能力的发展不会在青少年时期结束,而是会在成人阶段继续完善。因此,成功地适应迅速变化的世界所必须的新的知识和技能,需要终身学习才能满足;学生不可能在学校里学到将来所需的每一种知识和技能;学校的功能在于使学生具备终身学习的能力。
    DeSeCo成功地适应迅速变化世界所必须的、中小学能给予初步培养的知识和技能称作关键能力。DeSeCo认为必须依据社会发展现状特点和共同价值观来确定关键能力。当今世界的发展具有三个显著特征:一是日新月异的技术进步,二是多样化和区域化的社会,三是全球化带动了相互依赖新格局。而经合组织中所有国家都认为民主价值观和可持续发展至关重要,这些共同价值观认为:应该充分发挥一个人的潜力,但同样要尊重他人,为构建平等和谐的社会做出贡献。由此,DeSeCo将关键能力定义为:个人实现自我、终身发展、融入主流社会和充分就业所必需的知识、技能及态度之集合,它们是可迁移的并且发挥着多样化的功能。在义务教育结束时学习者应该具备这些基本的关键能力,并且在后续的终身学习中继续发挥其基础性作用。
    2000年3月,欧盟理事会里斯本会议为欧盟制定了一项战略性目标,即要把欧洲建设成“世界上最富竞争活力的知识经济体,并实现经济可持续发展,同时创造更多更好的就业机会,确保社会更加融合。”为了实现这个目标,欧盟教育与培训体制需要适应知识社会的要求,提高就业标准和质量,其主要措施就是聚焦关键能力。
    (二)关键能力的分类
    DeSeCo认为这个关键能力框架应该覆盖信息与传播技术(ICT)、技术文化、外语、创业能力和社会交往技能等,并建立专家组研究识别、定义关键技能,以及研究如何更好地把这些技能整合到课程计划中。DeSeCo专家组来自成员国、EFTA/EEA国家、其他相关国家和欧盟各协会,在广泛征求了政策制定者、政策分析家、工会、雇主、国家机构和国际机构以及社会学家、评价专家、哲学家、人类学家、心理学家、经济学家、历史学家、统计学家、教育学家等意见,并汇集了芬兰、法国、德国、瑞士和美国等11国调查报告,在前期测试和不断修订的基础上,DeSeCo于2003年完成了最终报告《成功人生和良好运转的社会所需的关键能力》,确立了知识社会必需的八个领域能力组成的关键能力框架。
    八个领域的能力都满足以下三个条件:一是能在推动经济发展和社会进步中能带来实实在在的利益;二是可以应用到多种生活领域,不仅是劳动力市场,也包括人际交往关系、政治参与等方面;三是应该适用于所有人。这八个领域的能力分别是母语交流能力、外语交流能力、数学能力和科学技术能力、数字化能力、学会学习的能力、人际交往和履行公民职责能力、创业能力、文化表达能力,每个领域下分多种具体的能力。
    ◇母语交流能力是指能用口头和书面形式(听说读写)来表达和解释思想、情感和事实,可以在教育与培训、工作场所、家庭和休闲等社会文化背景下进行恰当的语言互动。
    ◇外语交流能力是指根据自己的愿望或需求,在工作、家庭、休闲、教育与培训等社会背景下,用口头和书面形式(听说读写)来理解、表达和解释思想、情感及事实的能力。外语交流能力也要求具备跨文化间理解的能力。
    ◇最基础的数学能力指能借助心算和笔算手段,运用基本数学运算来解决日常生活问题。深层的数学能力包括:能够且愿意来使用数学思维模型(逻辑和空间思维),以及解释和描述现实中各种数学应用(方程式、模型、构造图、图表)。重点是过程而不是结果,是活动本身的意义而不是简单操练知识。科学能力是指使用现有知识和方法论来解释自然界的能力和意愿。技术能力则是综合理解和运用现有知识与方法论以改造自然环境,满足人类需求。
    ◇数字化能力是指自信而批判性使用信息/社会/技术(IST)来工作、休闲和交流。这些能力与逻辑思维和批判性思维、高水平的信息管理技能、娴熟的交流技巧有关。最基础的信息传播能力指,用多媒体技术来检索、评估、存储、生成、展示和交换信息,使用互联网来进行交流。
    ◇学会学习的能力包括在个体或团队情境中组织和协调个人学习的能力。它包括了有效管理个人时间、解决各种问题的能力,善于处理不同的程序性事件,评价和吸收新知识,并把新知识及技能应用到家庭、工作、教育与培训等各种情境的能力。更广义上说,学会学习的能力对落实个人职业生涯规划颇有价值。
    ◇人际交往能力包括掌握必备的行为,使个人能以有效和建设性的方式来参与社会生活、解决彼此间冲突。人际交往能力是群体中人与人有效互动的基础,可应用于公共与私人领域。履行公民职责能力的范围比人际关系能力的范围要广,因为它们存在于社会交往关系层面。它是指个人积极参与公民生活的各种能力。
    ◇创业能力中有主动与被动两种因素:它既有积极重塑自我的倾向,也包括赞赏、支持和适应外部革新。创业能力要求个人勇于承担自己的行为,拓宽战略视野,善于设定目标并积极予以实现,不断激励自己去取得一个又一个成功。
    ◇文化表达能力指善于利用各种媒体,包括音乐、肢体表达、文学和造型艺术,创造性地表达观念、经验和感情。
    DeSeCo项目组把关键能力视作个人生活成功、社会良好运转的重要条件。2004年欧盟委员会和欧盟理事会对关键能力提出了指导意见,主张每个人应该能获取关键能力,未来学习和成功都取决于关键能力。
    (三)关键能力的作用
    第一,关键能力框架把知识社会中个人成功、社会和谐及就业问题所需的能力进行了全面梳理,为学习型社会和终身教育体系的建设提供了前后一贯的思考框架。
    第二,关键能力框架为政策制定者和学校等教育机构提供了“参照工具”,使他们能及时更新学校课程,选择合适的能力框架以满足不同阶段学习者的需求。调查表明欧盟义务教育课程日益关注关键能力。
    第三,关键能力框架为学校教育评价及成人能力评价提供了一个指导框架。尤其重要的是关键能力框架所强调的:“各种关键能力最初在学校中培养,随后在一生中不断发展”的观念,一方面为不同阶段的学校指出了效能边界,同时也将终身学习的理念深深地嵌入了各个阶段学校教育的实践中。
    (四)关键能力与PISA
    国际学生评价项目PISA是研究如何通过恰当的标准来评价学习者在义务教育结束时是否具备了上述的关键能力。PISADeSeCo保持着密切的互动关系,彼此都不断地进行调整。
    DeSeCo的关键能力与学校课程之间并非是一一对应的,以学校课程的纬度可以把关键能力分为两大类:一是课程范围内的能力,例如,与他人交往的能力、基础的科学/数学技能、电脑与表达能力、个体角色定位的能力;二是跨学科能力,例如,元认知能力、个人内在能力、人际交往能力、个人职位能力。正因为这个原因,PISA虽将阅读、数学、科学作为重点测试学科,但PISA评价的重点并不在于检验学生是否很好地掌握了某一具体的学校课程,而主要是评价学生上述学科所涉及的关键能力,即是否准备好去应对未来的挑战,他们是否具有有效地分析、推理与交流自己的思想观点及终身学习的能力。2003年新增的问题解决能力的测试,则更体现了PISA强调关键能力以及跨学科的性质。
    四、国际学生评价计划(PISA)评价结构和测试工具设计
    由于立足于终身学习和关键能力,PISA评估结构和测试工具设计与其他国际性评价相比,有着显著的不同。如国际科学与数学调查趋势(TIMSS),只关注“学校”的知识,主要考察学生对学校课程的学习情况;而PISA评价关注的是青少年现在和将来的生活中所必需的基本的阅读素养、数学素养、科学素养和问题解决能力以及他们的学习习惯、家庭等背景因素的影响。阅读素养、数学素养和科学素养的评价包括内容、过程和应用三个维度;问题解决能力主要考察学生在综合解决问题时的分析、判断和决策能力。在这些素养的测评过程中,PISA还特别关注学习者的反思性思考和行动(reflective thought and action)。
    PISA的评价内容和评价框架都是基于“素养”(Literacy)这一概念提出的。其将“素养”定义为:学生运用所学知识和技能,有效进行分析、推论、交流,在各种情景中解决和解释问题的能力。由于主要是关注学生从已学到的知识推断(extrapolate)新知识的能力或将知识应用于新情境(novel settings)的能力,因此,PISA有三个明显的特征是:一是情景,强调真实的社会生活或生产活动的情景;二是运用,强调运用已学到的知识进行解释或解决问题;三是思维,强调进行有效分析、推论、交流等思维能力。
    (一)阅读素养的界定与测评
    1.阅读素养的界定
    阅读能力是对书面文字的理解、运用和反思的能力,以实现个人目标,丰富自身知识及开发自身潜能,以便更好地参与社会活动PISA不再把阅读能力看作仅仅是儿童在早期学校教育中掌握的能力,而是认为阅读能力是学生在各种情境下,与同伴及社区进行互动,不断扩充个人所掌握的知识、技能和策略的能力。
    PISA对阅读素养评价的目的是为了解特定的学生是否为参加各种社会活动和参与各自的群体做好了充足的准备,因此,根据对现实阅读情境的模拟,PISA阅读评价测量下列五种过程:检索信息、形成广义整体理解、解释原因、反思和评价文本内容、反思和评价文本形式。
    阅读能力
    主要使用文本内信息
    引用文本外信息
    关注文本各部分
    关注文本内信息间关系
    关注内容
    关注结构
    全文
    文本各部分间关系
    检索信息
    形成宏观理解
    解释原因
    反思及评价文本内容
    反思及评价文本形式
     
     
     
     
     
     

    阅读能力五种过程的不同特征
    PISA对每种过程下可操作性的定义,定义分为两个部分:一是过程的总体概述,二是描述进行过程评价的特定方法。如检索信息的总体概述为“在日常生活中,读者常需要某些特定信息:一个电话号码或者是巴士、列车的出发时间。在阅读者检索单个信息的情境中,他们需要浏览、搜索、定位、选择相关信息。信息检索过程常处于句子层面,但有时需要检索两个或两个以上的句子,或检索不同的段落。”检索信息评价的特定方法为“在要求检索信息的任务中,受测试者必须将问题中的信息与文本相同信息相匹配或者与文本中同义信息对应,以此来找到所需的新信息。在这些任务中,检索信息是以文本本身及其所包含的明确信息为基础的。检索信息的任务要求受测试者找到问题中要求的或指定的信息。受测试者需搜索或识别问题中一个或多个基本要素,诸如特征、地点、时间、背景等,然后搜寻相匹配的文字或同义信息。
    2.阅读素养的评价结构
    PISA通过提供一系列的阅读文本,并对每个文本设置一定的阅读任务,根据学生完成阅读任务的情况来对其阅读素养进行评价。阅读任务通过不同类型的试题来呈现。
    1)阅读任务
    阅读素养评价按检索信息、解释文本、反思和评价等三类阅读任务进行分类。表1.1为三次评价中阅读素养测试的任务分布,其中2000年阅读素养作为主要测试能力领域,2003年和2006年作为次要测试能力领域。
    1.1 阅读素养测试中任务的分布
    阅读过程
    任务所占比例(%%uFF09
    2000
    2003年/2006年
    检索信息
    29
    29
    解释文本
    49
    50
    反思和评价
    22
    21
    合计
    100
    100
    PISA200020032006的评估中,检索信息类占总任务的29%,要求学生形成独立检索信息的技能;解释文本类占近50%,要求学生关注文本内的信息关系,包括形成广义整体理解与解释原因两个过程;反思和评价类任务,占总任务近20%,要求学生反思文本内容信息或文本自身的结构形式。
    2)文本类型
    阅读素养的评价提供的阅读文本分为连续文本与非连续文本两种格式。连续文本通常由句子组成,句子再组成段落,段落再组成节、章和书等更大的结构。最基本的非连续文本是清单,清单常由许多有共同属性的条目所组成,可以根据这些共同属性来编制清单卷标或标题,也可以对条目进行排序或者不排序。
    连续文本格式包括记叙、释义、描述、议论、说明、文件或记录、超文本等类型。非连续文本格式包括图表和图形、表格和矩阵、图解、地图、数据表格、信息单、邀请和广告、凭证、证明等类型。文本类型的分配是PISA评估的重要特点。表1.2PISA三次测试中文本类型的分配。在阅读素养测试题中连续文本占2/3,非连续文本占1/3;连续文本中释义性文体所占比例最大,非连续文本中图表和图形、表格占有较大比例。
    1.2 阅读素养测试中文本格式和类型的分布
    文本格式和类型
    各种类型文本在各自文本格式测试题中所占的比例(%%uFF09
    各文本格式和类型占全部阅读测试题中所占的比例(%)
    2000
    2003年/2006年
    2000
    2003年/2006年
    连续文本
     
     
     
     
    记叙
    21
    17
    15
    11
    释义
    36
    67
    24
    42
    描述
    14
    17
    9
    11
    议论
    20
    13
    说明
    10
    7
    合计
    100
    100
    68
    64
    非连续文本
     
     
     
     
    图表和图形
    37
    20
    12
    7
    表格
    29
    40
    9
    14
    图解
    12
    4
    地图
    10
    10
    3
    4
    数据表格
    10
    30
    3
    11
    广告
    2
    1
    合计
    100
    100
    32
    36
    3)题型和情景设计
    阅读任务主要通过以下几种类型的试题呈现出来:开放性的建构题、封闭性的建构题、单项选择题以及多项选择题。表1.3反映了PISA200020032006的测试中,阅读素养测试题型的分布情况。开放性试题和多项选择试题占了近80%
    1.3 阅读素养测试中题型的分布
    阅读过程
    开放性的建构题
    封闭性的建构题
    单项选择题
    多项选择题
    合计
    2000
     
     
     
     
     
    检索信息
    8
    2
    6
    13
    29
    解释文本
    32
    2
    2
    13
    49
    反思和评价
    2
    2
    18
    22
    合计
    42
    6
    9
    44
    100
    2003
    2006
     
     
     
     
     
    检索信息
    4
    14
    11
    29
    解释文本
    29
    3
    7
    11
    50
    反思和评价
    21
    21
    合计
    29
    7
    21
    43
    100
    4)阅读情景
    PISA认为人总是在某一特定情境下进行阅读活动的,所以将阅读素养的评估放置在各种阅读情境中。但这里的“阅读情境”不能简单地理解为阅读活动发生的环境,它所强调的是不同的阅读目的。欧洲理事会语言研究中心(2001年)将阅读情境确定为以下四类:个人用途的阅读,公共用途的阅读,工作用途的阅读和教育用途的阅读。表1.4反映了PISA200020032006的测试中,阅读素养测试试题情景的分布情况。
    表1.4 阅读素养测试试题情景的分布
    试题情景
    所占比例(%%uFF09
    2000
    2003年/2006年
    个人
    20
    21
    公共
    38
    25
    职业
    14
    25
    教育
    28
    29
    合计
    100
    100
    5)量规
    PISA基于个人能力水平和测试题难度的持续性,建立了对学生测试成绩进行解释的试题回答理论(Item Response TheoryIRT)的数学模型,并建立了5个水平层级的“阅读能力等级”。阅读能力评价的结果首先是用单一阅读能力等级指数来概括,均值500,标准差100。另外,学生成绩也有5个子层次:三种过程(方面)子层次(检索信息,解释文本,反思和评价;OECD2001a)以及两种文本形式子层次(连续文本和非连续文本;OECD 2002b)。通过这五种子层次,就可以比较子群体和参与国的阅读能力结构要素的平均分以及分数分布。虽然这些子层次间存在高度的关联性,每个子层次的汇报结果会表明参与国之间有趣的互动。当出现这些特征时,就可以对其检测,并与课程大纲和教学方法论相联系。在一些国家中,重要的问题是如何更好地传授现有课程大纲;在其他国家,问题不是如何教,而是教什么。
    3.阅读素养的试题范例
    ACOL流感疫苗注射计划(PISA2000
    大家都知道,在冬天,流感可能在人群中迅速地大规模传播,并有可能一连持续几个星期。
    抵抗流感病毒的最好办法就是保持身体健康强壮。为了增强免疫系统抵抗病毒的能力,应该坚持每天锻炼身体,并且多吃水果和蔬菜。
    ACOL将为全体员工注射流感疫苗― ― 这是抵御流感病毒的又一种方法。ACOL安排了一位护士在5月17号的那个星期到ACOL来,用半天的工作日时间给员工注射疫苗。所有ACOL的成员都可以免费进行流感疫苗注射。
     
     
     
     
     
     

    注射疫苗是自愿的。凡自愿注射疫苗者都要签字说明自己属于非过敏体质,并且已经了解到疫苗注射以后的一些轻微的副作用。
    医学证明,注射流感疫苗不会使人得流感,但是会有一些副作用。比如疲劳、低烧、四肢无力等。
    哪些人应该注射流感疫苗?
    任何想保护自己不受病毒侵害的人。
    特别建议年龄在65岁以上的人注射疫苗。不论年龄大小,凡患有慢性疾病而导致身体虚弱者,特别是心脏病、肺病、支气管疾病以及糖尿病惠者,也建议注射疫苗。
    在办公室环境里,所有人都有患流感的危险。
    哪些人不应该注射流感疫苗? 对鸡蛋过敏的人、发高烧的人、怀孕的妇女。
    和你的医生核对一下,是否你目前在服用其他药物,以及是否曾经对注射流感疫苗起过反应。
    如果你想在5月17号那周注射流感疫苗的话,请于5月7号星期五之前告知人事部主管Fiona McSweeney。注射疫苗的具体日期和时间将根据那位护士方便的时间、注射疫苗的人数、以及大多数成员方便的时间来定。如果你想注射疫苗而时间又不方便的话,请告知Fiona。如果人数多,可以再安排一次注射时间。
    想了解更多信息,请拨分机号5577与Fiona联系。
    Fiona McSweeney是一个叫ACOL的公司的人事部主管,为ACOL的员工准备了上面这段文字,根据其中所提供的信息,回答下列问题。
    1题:下面哪一项描述了ACOL注射流感疫苗计划的一个特征?
    A 在冬天,每天都将开设健身课程。
    B 流感疫苗将在工作时间内注射。
    C 参加流感疫苗注射者可以得到一点奖金。
    D 一位医生将会前来注射流感疫苗。
     
    阅读任务:获取信息
    文本类型:连续性文本
    阅读情境:为了工作而阅读
    第1题评分标准:
    得1分:选择B― ―流感疫苗将在工作时间内注射。
    得0分:选择其他选项。
     
    2题:我们可以谈论一篇文章的内容(它写了些什么)。
    我们可以谈论一篇文章的形式(文章是怎样写的)。
    Fiona希望她以上的这份信息单的形式会让人读起来很亲切.而且能鼓舞人。
    你觉得她做到这一点了吗?
    参考文章的版面设计、写作风格、图片或其他图示。具体解释你的答案。
     
    阅读任务:反思与评价
    文本类型:连续性文本
    阅读情境:为了工作而阅读
    2题评分标准:
    2分:基于文本来回答问题,并将文章的形式和其写作目的联系起来讨论,而且和作者“亲切与鼓舞人”的目标相一致。学生的回答情况应至少符合以下两点中的一点:
    (1)详细论述了以下特点中的一点(版面设计、写作风格、图片或其他图示,或者其他相类似的细节)―― 也就是说,要具体谈论文章的某一具体特点或特质。
    (2)使用除了“亲切”“鼓舞性”之外的评价性的词汇。(注意:只说出像“有意思”、“容易理解”、“清楚明白”这样的词汇是不够充分具体的。)
    关于Fiona是否做到了这一点(文章让人读起来很亲切,而且能鼓舞人),结论可以明确表达出来,也可以隐含在论述中,例如:
    不,她没有做到这一点。因为把一幅注射器的图片放在文章的开头不好。它让人看起来很害怕。[依据了文本中的一项具体信息:一张图片(1);使用了自己的评价词:“让人害怕”(2)]
    是,她做到了这一点。因为插图把文章划分成了两部分,以便于阅读。[描述了文章版面设计的一个特点。(1)]
    卡通造型的病毒图片让人看起来很亲切。[谈到了插图的一个特点:“卡通造型”。(1)]
    不,她没有做到这一点。因为文中的图片看起来很幼稚,而且图片之间没有关系。[使用了自己的词汇“幼稚”、“没有关系”来评价文章的特点。(2)]
    是,她做到了这一点。文体风格是轻松随意的,是非正式的。[使用了自己的词汇“轻松随意”、“非正式”来评价文章的特点。(2)]
    是,她做到了这一点。文体风格是热情而吸引人的。[使用了自己的词汇“热情”、 “吸引人”来评价文章的特点。(2)]
    文章太长了,人们不会有耐心去读它。[谈到了文章的一个特点:篇幅(1);使用了自己的评价性词汇。(2)]
    她没有强迫人们注射流感疫苗,这将给人们以鼓舞。[暗指了文章的基调和作者的态度,属于文体风格的一部分。(2)]
    不,她没有做到这一点。文章的写作风格非常正式。[这种观点有争议,但合理地使用了自己的评价性词汇:“正式”。(2)]
    1分:基于文本来回答问题,并将文章的写作目的和其内容(而不是文章的形式)联系起来讨论,论述作者是否实现了她的目的,即“亲切与鼓舞人”。关于Fiona是否做到了这一点(文章让人读起来很亲切,而且能鼓舞人),结论可以明确表达出来,也可以隐含在论述中,例如:
    不,她没有做到这一点。让人注射疫苗的文章绝不会让人看起来亲切、具有鼓舞性。
    是,她做到了这一点。她给人提供了很多机会,人们可以选择注射疫苗的时间。而且,她还对保持健康提出了建议。
    0分:答案不充分,或者模糊不清。例如:
    是,她做到了这一点。因为文章提出了一个好主意。
    是,她做到了这一点。因为文章亲切而鼓舞人。[没有具体谈论文章的特点]
    不,她没有做到这一点。因为这个办法不管用。
    不,她没有做到这一点。因为信息是不正确的。[谈到了内容,但没有和“亲切与鼓舞人”联系起来]
    是,她做到了这一点。文章的插图很鼓舞人,而且写作风格也容易被人接受。[“文章的插图很鼓舞人” 没有具体论述;“写作风格容易被人接受”太模糊]
    是,她做到了这一点。容易读,很清楚。[使用的词汇不够具体]
    答题情况反映了对文章理解上的错误,或者答案不合理,或者答非所问。例如:
    是,她做到了这一点。每个人都应当注射疫苗。[不正确,答非所问]
    不,她没有做到这一点。图片和文章没有关系。[不正确]
    是.她做到了这一点。她想让大家对患流感感到担忧。[和文章“热情”、“吸引人”的意思相矛盾]
    这很好,但只是个建议。[答非所问]
     
    3题:这段文字暗含的意思是:如果你想保护自己而不受病毒侵害,那么注射流感疫苗。
    A 比参加锻炼和健康饮食更有效.但也更具风险性。
    B 是一个好主意,但它不能代替参加锻炼和健康饮食。
    C 和参加锻炼、健康饮食一样有效,而且没那么麻烦。
    D 如果你参加大量的体育锻炼,并且饮食健康的话,这个根本就不值得考虑。
     
    阅读任务:解释文本
    文本类型:连续性文本
    阅读情境:为了工作而阅读
    3题评分标准:
    1分:选择B―― 是一个好主意,但它不能代替参加锻炼和健康饮食。
    0分:选择其他选项。
     
    4题:这段文字中有下面这部分内容:
    Fiona将信息单发布出去以后,一位同事告诉她说应该删掉“任何想保护自己不受病毒侵害的人”,因为这么说会使别人误解。
    你认为这句话会使人误解而应该删掉吗?解释你的原因。
     
    阅读任务:反思和评价
    文本类型:连续性文本
    阅读情境:为了工作而阅读
    4题评分标准:
    1分:联系“误解”一词评价文章,指出文章潜在的矛盾之处。(“哪些人应该注射流感疫苗?任何?? ”;“哪些人不应该注射流感疫苗?”)可能解释了,也可能没解释矛盾到底是什么。回答不管是肯定的还是否定的,这个结论可以明确表达出来,也可以隐含在具体的论述中,例如:
    ◇是,这句话会使人误解而应该删掉。因为有些人注射疫苗将是十分危险的。(例如:孕妇)[对存在的矛盾进行了描述]
    ◇不,这句话不会使人误解,不应该删掉。因为只要你再读上几行就会知道,有些人不应该注射疫苗,但总体上说,她是希望人们注射的。
    ◇是,这句话会使人误解而应该删掉。因为她说“任何人”都能注射,后来却又说有些人不能注射。[找到了矛盾所在]
    ◇这句话说每个人都应该注射疫苗,这是不对的。[简单地指出了矛盾]
    或者:联系“误解”一词评价文章,指出这句话说得太夸张了。(并不是每个人都需要注射疫苗,或者说注射疫苗也不能解决所有问题)可能解释了,也可能没解释到底哪儿夸张了。回答不管是肯定的还是否定的,这个结论可以明确表达出来,也可以隐含在具体的论述中,例如:
    ◇应该删掉这句话,因为注射流感疫苗并不能保证让你不得流感。
    ◇我不同意删掉这句话,虽然这句话听起来好像意思是你要不注射流感疫苗,你就肯定会得流感似的。
    ◇注射流感疫苗不能保证万无一失。
    ◇应该删掉这句话,因为如果不是身强体壮的话.每个人都会得流感。
    ◇是,我同意删掉这句话,因为它言过其实了。[尽管不太具体,但指出了有夸张的成分存在。]
    0分:对文章作出了评价,但没有联系“误解”一词。例如:
    (1)指出这句话很有说服力,很有效,而且/或者很鼓舞人,但没有提到潜在的矛盾或让人产生误解的因素。
    (2)指出这句话“任何想保护自己不受流感病毒侵害的人”很多余,因为任何人都是想保护自己而不受流感病毒侵害的。
    ◇留着这句话很好,因为它能鼓舞人。[(1)]
    ◇这句话应该留着,因为它可以使这张信息单更突出。[(2)]
    ◇我觉得这句话应该删掉,因为很明显,每个人都是想保护自己而不受流感病毒侵害的,虽然不一定要通过注射流感疫苗来实现。[(2)]
    或者:回答不充分或者模糊不清,或者只是把“误解”这个词又说了一遍,而没有具体解释。例如:
    ◇留着这句话,它很好。[没有做出解释]
    ◇他们应该在那儿放一张图片,而不是放那个句子。[没有做出解释]
    ◇是的,这句话会让人误解,会带来麻烦的。[没有做出解释]
    或者:答题情况反映了对文章理解上的错误,或者答案不合理,或者答非所问。例如:
    ◇这句话应该删掉.因为每个人都有权利自己做决定。[误解了文章的基调:这不是一项命令。]
    ◇我觉得应该把“流感”这个词放到“病毒”这个词前面,因为如果人们是随便扫一眼这张信息单的话,他们可能会认为这是在谈论别的病毒,而不是流感病毒。[对“误解”的解释不太合理]
    ◇是的,人们可能会感兴趣,但是他们可能会害怕打针。[答非所问]
     
    5题:根据上面这段文字所提供的信息来判断,哪些员工将应该和Fiona联系?
    A 市场部的Steve。他不想注射流感疫苗,因为他更相信自己身体的免疫系统。
    B 销售部的Julie。她想知道注射流感疫苗计划是不是强制性的。
    C 邮件收发室的Alice。她想注射疫苗,但是两个月以后要生孩子。
    D 财务部的Michael。他想注射疫苗,但5月17号那一周他将外出。
     
    阅读任务:解释文本
    文本类型:连续性文本
    阅读情境:为了工作而阅读
    5题评分标准:
    1分:选择D― ― 财务部的Michael,他想注射疫苗,但5月17号那一周他将外出。
    0分:选择其他选项。
    (二)数学素养的界定与测评
    1.数学素养的界定
    数学能力是一种个人能力,学生确定并理解数学在社会所起的作用,得出有充分根据的数学判断和能够有效运用数学。这是作为一个有创新精神、关心他人和有思想的公民,适应当前及未来生活所必需的数学能力。PISA 数学能力领域关注的是学生在各种学科和情境下提出数学问题、表述问题、解决问题和解释问题解决方法中的分析、推理和观点交流的能力。
    PISA是通过数学思想、数学过程、应用情景三个维度来描述和评价学生数学素养的。
    第一维度是数学思想,PISA将“量、空间和形状、变化和关系、不确定性”作为数学最重要的四个主要观念,并根据这四个主要观念定义数学内容;
    第二维度是数学过程,PISA用典型数学能力和能力群来定义数学过程,PISA将“思考和推理,论证,交流,建模,问题提出和解决,表述,运用符号、形式、技术语言与运算,使用帮助和数学工具”等八种典型数学能力分成三种能力群,即再现群、联系群、反思群。这三种能力群都包含八种能力,但各种能力在不同群内的含义是有区别的。如论证能力,再现群的论证是指遵循和证明标准数量过程,包括计算的过程、陈述和结果;联系群的论证是指一些简单的数学推理,遵循和评定一系列的不同类型的论据,持有诸如我们知道些什么,想得到什么的一些启发式的问题。
    第三维度是应用情景,PISA使用了个人的、教育的、职业的、公共的和科学的五种情境,来定义现实问题数学化处理的方法和形式。
    2.数学素养的评价结构
    情境
    语境
    知识
    主要观念
    问题
    解决
    问题形
     
    能力群组
    过程
    能力
    PISA是紧紧扣住情景、数学思想(主要观念)、数学过程(典型能力和能力群)这三个要素对学生的数学素养进行评价。图2.1示意了数学能力框架关键要素。
     
     
     
     
     
     
     
     
     
    图2.1数学能力框架关键要素示意图
     
    PISA认为数学素养是个体具有处理好数学问题存在的背景和情境、解决问题所必需的数学知识(运用主要观念)、将现实情境转化为数学问题(即“数学化”)所必需能力的综合表现。
    (1)情景
    测试题包括情境材料、信息或实际问题。测试题的情境是:个人的、教育的、职业的、公共的和科学的情境。测试题情境最好是真实情境。也就是说,PISA评价最高级任务是现实情境任务,用数学来解决问题的情境也要真实。设计和选择测试题时要注意考虑测试题的阅读要求,测试题措辞应尽可能简单直接,还要注意避免出现有文化偏见的问题情境。全部数学测试时间尽可能平均分配于个人的、教育的、职业的、公共的、科学的情境五种情境。
    (2)主要观念
    数量、空间与形状、变化和关系、不定性四种主要观念被融入大量能力测试中以确保测试题覆盖数学教学课程内容,每种主要观念是现象和概念的交织,代表着特定的视角或观点,都可视作是数学能力的核心。全部数学测试时间尽可能平均分配于数量、空间与形状、变化和关系、不定性四种主要观念。
    (3)数学过程
    PISA没有设计测试题来单独评价上述每种能力。在解决数学问题时,需要综合利用多种数学能力,所以要单独评价某种能力,会产生伪测试任务,把各种数学能力不必要地割裂开来。复现群组、联系群组和反思群组三种能力群组的试题比例约是1:2:1。
    复现能力群组测试题涉及的解决问题方法直接,形成例行过程,几乎不用数学化现实情境。复现能力群组的要素是标准表述和定义、例行计算与例行程序。
    联系能力群组问题要求学生有推理、解释和反思能力,并在多种能力间进行关联与整合。联系能力群组的要素是推理、反思和解释等标准问题解决过程。
    反思能力群组测试题要求学生有数学洞察力,遇到不熟悉情境时能创建解决方法,并运用最高级别的数学化过程――将现实问题抽象化,转换为数学问题。学生思考解决策略时,既需要联系能力群组,也需要反思能力群组。两者之间的区别在于复杂程度或创新程度不同。反思能力群组的要素是用洞察、解释、反思和抽象化等能力来创建复杂问题解决方法。
    (4)题型
    PISA通过综合开放式建构性回答、封闭式建构性回答与多项选择题等形式来评价数学能力。PISA2003测试数量均等地使用了这些测试题形式。根据设计试题与使用试题的经验,多项选择测试题是最适合于评价复现能力群组和联系能力群组的;开放式建构回答测试题不仅要求学生得出答案,而且要求学生列出解决问题采取的步骤或解释答案是如何得出的,对学生有更高层次的知识与能力的要求。
    PISA测试题中使用了同一刺激物中提出几个问题的格式。它通过一系列逐渐复杂的问题使学生进入情境或问题中。前面几个问题是以典型的多项选择题或封闭式建构性题型为主,而随后的测试题是以典型的开放式建构性题型为主。表3.1是PISA2003数学能力测试120道题试题类型分布情况。
    表3.1 PISA2003数学能力试题类型分布
    测试题类型
    能力群组
    合计
    复现群组
    联系群组
    反思群组
    多项选择
    约15
    约20
    约5
    约40
    封闭式建构回答题
    约10
    约25
    约5
    约40
    开放式建构回答题
    约5
    约15
    约20
    约40
    合计
    约30
    约60
    约30
     
    PISA 2003测试要求在210分钟测试时间内完成多达120道数学题。这些试题将被分成7组,每组试题测试时间为30分钟。测试题根据循环测试设计原则排列。试题有各种难度,适合各个OECD国家学生的预期能力范围,能力框架主要分类(特别是能力群组与主要观念)应尽可能体现于不同难度测试题之中。
    5)量规
    PISA测试工具的能力表现量表分为五个层次。量表运用了测试回答建模方法(Item Response Modelling,IRT)来评价测试结果数据。量表通过五个表现层次来对各国学生的表现进行分类,以提供进行国际性比较的参考框架。
    3.数学素养的试题范例
    1 步行
     
     
     
    上图是某男士步行的脚印,P表示两个连续脚印的脚后跟之间的距离,叫做步幅。对于男性来说,公式,可以计算出np之间的关系。其中n=每分钟的步数,p=步幅(米)。
    问题1:某男同学每分钟行走70步,用上述公式计算,他的步幅是多少?请详细列出计算方法。
    问题2:小罗知道自己的步幅是0.8米,用上述公式计算他的步速每分钟多少米和每小时行走多少千米。请详细列出计算方法。
     
    题项类型:封闭式建构回答题
    能力群:复现
    数学思想:数量
    情境类型:公众的
     
    建筑物B
     
    办公室空间
     
    35-260平方米
    每平方米90zeds
    建筑物A
     
    办公室空间
     
    58-95平方米
    每月475 zeds
     
    2 租房
    下面两段出现在某国家的日报上,当地的货币是zeds。如果某公司要租110平方米的办公室,租期为1年。
    问题:A楼与B楼,公司租哪幢楼合算?列出你的计算过程。
     
    题项类型:封闭式建构回答题
    能力群:联系
    数学思想:数量
    情境类型:公众的
     
    例3 刹车
    刹车刹住一辆在移动的车辆的大约路程是下面两部分之和:(1)司机从发现情况到开始刹车这段时间内驶过的路程(反应时间路程);(2)使用刹车后驶过的路程(刹车路程)。
    例3 图
    图中的“蜗形轮”图形反映的是一辆车在良好刹车状态(一个特别机警的司机且刹车和轮胎完好、路面干燥)下的理论停车路程以及停车路程是如何根据汽车速度变化的。
    数学问题1:如果一辆车以11O公里/小时的速度行驶,反应时间路程是多少?
    数学问题2:如果一辆车以110公里/小时的速度行驶,停车路程是多少?
    数学问题3:如果一辆车以110公里/小时的速度行驶,停车时间是多少?
    数学问题4:如果一辆车以110公里/小时的速度行驶,刹车路程是多少?
    数学问题5:如果一个司机在路况很好的路面上行驶,停车路程是7O.7米,其刹车时的速度是多少?
     
    题项类型:开放式建构回答题
    能力群:联系
    数学思想:变化和关系
    情境类型:公众的
     
    例4 捕鱼
    某池塘养了一些鱼,下图表示水池中鱼的总重量增长数学模型。
     
     
     
     
     
     

    问题:如果某渔民想若干年后捕捞池塘里的鱼,要想实现年捕鱼量最多,他需要等几年?列出论证过程。
     
    题项类型:开放式建构回答题
    能力群:反思
    数学思想:不定性
    情境类型:职业的
    (三)科学素养的界定与测评
    1.科学素养的界定
    PISA 2006中的科学素养是指个体能够掌握科学知识,应用科学知识来确定问题,获得新知识,解释科学现象,得出科学相关问题的有根据的结论;理解作为人类获取知识和探究方式的科学的特征;关注科技塑造我们的物质、精神和文化生活的方式;愿意从事与科学相关的事务,有科学观念,成为会思考的公民PISA认为科学素养这一领域不仅考察学生在涉及科学和技术的生活情境中对科学知识的分析、推理及灵活运用的能力,还要求评价学生表现出来的对科学的兴趣态度,即对科学的兴趣,支持科学探究,对自然资源、环境等表现出的责任感等。
    PISA2006的科学素养界定比PISA 2000PISA 2003的科学素养界定范围要广,增加了对科学事件或技术发展的反应态度。PISA2006是通过知识、能力、态度三个维度来描述和评价学生科学素养的。
    ◇第一维度知识PISA认为科学素养包括科学的知识(有关自然世界的知识)与关于科学的知识。科学的知识是指基本科学概念和理论,涉及物理系统、生命系统、地球空间系统的关键概念;关于科学的知识主要是指理解人类科学活动的属性与科学知识的作用与局限,主要涉及科学探究、科学解释、社会中的科技等方面。
    ◇第二维度能力,PISA认为科学素养包括科学能力,其核心是科学探究能力,基础是逻辑推理和批判性分析,主要是指识别科学问题、科学地解释现象、有根据地得出结论的能力。
    ◇第三维度态度,PISA认为科学素养的形成过程取决于个人对科学的态度及其从事科学相关事务的意愿,态度主要是指对科学有兴趣、支持科学探究、对自然资源与环境有意识地采取负责任行动。
    2.科学素养的评价结构
    科学素养的测评形式为纸笔测试,测试在学生所在的学校进行,测试时间为2个小时。此外,学生需要做1.5小时的背景问卷,主要关于学生自己及其家庭情况;学校领导则需要做一个有关他们学校情况的20分钟的问卷。
    PISA2006要求学生在现实情境中应用特定科学知识,使用科学能力,评价科学态度,重点关注科学素养的各个方面。图3.1示意了科学素养测试框架。
    回答的态度
    对你的做法的影响来自:
    要求你:
    情境
    能力
    知识
    生活中的科技情境
     
     
    *识别科学问题
    *解释科学现象
    *使用科学证据
     
    你所知道的知识是:
    *关于自然世界
    (科学的知识)
    *关于科学本身
    (关于科学的知识)
    你怎样回答科学问题(兴趣、支持科学探究、科学责任)?
    图3.1 PISA 2006科学测评框架
    1)情景
    PISA 2006科学素养测试题的情景设置不局限于课堂,更强调日常生活情境。测试题的情景主要有三类,即家庭和同伴(私人情境)、社区(社会情境)及世界(全球情境),重点是个体生活情境,有时也会有历史性情境。测试题情境在个人的、社会的、全球的情境中平均分布,测试单元将会应用较多情境,情境设计也要尽可能地满足能力框架的限制条件。测试题型分多重选择题和建构性回答题两种类型。
    2)能力
    科学能力包括识别科学问题、科学地解释现象、有根据地得出结论的能力。识别科学问题的关键是将科学问题与其他问题区别开来;科学地解释现象是要运用科学知识来描述、解释或预测科学现象的变化,还要识别或确定相关的描述、解释和预测;有根据地得出结论是能表述证据与结论(或决策)之间清晰的逻辑联系,即要评价科学信息并根据科学证据来得出结论、从证据推出的各种结论中进行选择、从数据推出结论的过程视角来赞成或反对结论并给出理由、识别结论推导中的假设、思考科学结论的社会意义。
    PISA 2006认为科学能力既要应用科学的知识,也要应用关于科学的知识,但能力不同于知识。如解释科学现象能力,如果测试题的重点是考察学生对给定科学探究或证据的解释、理解,那么就不是一种能力考查;当测试题的考察重点是如何应用科学知识来描述、解释或预测科学现象时,“科学地解释现象”能力才会发挥作用。PISA强调需要有足够的试题量来测评每种能力,以确保测试标准的可靠,表3.1PISA 2006科学素养科学能力的分布情况。
    3.1 PISA 2006科学素养测试中科学能力的分布
    科学能力
    分值所占比例
    识别科学问题
    25-30
    科学地解释现象
    35-40
    使用科学证据
    35-40
    合计
    100
    3)知识
    PISA 2006测试的科学知识涉及物理系统、生命系统、地球空间系统的知识,但因时间和试题数量的限制,不可能涵盖科学课程的知识。PISA 2006确定了以下三个标准来选择评价内容:一是与现实情境有关;二是选定的知识要代表重要的科学概念以使测评结果长期有效;三是选定的知识应适合15岁学生的科学知识掌握水平。物理系统主要涉及物质的结构和属性、物质的物理变化和化学变化、运动和力、能量及其转化、物质和能量互换等方面的知识。生命系统涉及细胞、人体、人口、生态系统、生物圈等方面的知识。地球空间系统涉及地球系统的结构、地球系统的能量、地球系统的变化、地球的历史、宇宙中的地球等方面的知识。
    PISA 2006测试的关于科学的知识包括科学探究、科学解释、社会中的科技。科学探究涉及科学问题、目的、观察和实验、数据、测量、结果的特征。科学解释涉及类型(如假设,理论,模型)、构成(如现有知识与新证据,创造力和想像力、逻辑)、规则(如逻辑一致性,根据证据)、结果(如新知识,新方法,新技术,新调查)。社会中的科技涉及科学的角色、科学与技术间的关系、风险、影响、挑战、局限。
    3.2 PISA 2006科学素养测试中科学知识的分布
    科学的知识
    分值所占比例/%
    关于科学的知识
    分值所占比例/%
    物理系统
    20-25
    科学探究
    10-15
    生命系统
    25-30
    科学解释
    10-15
    地球和空间系统
    15-20
    社会中的科技
    10-15
    小计
    60-65
    小计
    35-40
    PISA 2006科学素养测试,在分值上有60%是评价“科学的知识”的,有40%是评价“有关科学的知识”的,这反映了PISA所强调的“有关科学的知识”与“科学的知识”同样重要的观点。
    (四)态度
    为了更全面地测评科学素养,PISA2006把对科学的态度首次列入测评范围之内。PISA2006对科学素养的测评采用了一种全新的方式来测评学生的态度。在学生的调查问卷中,不仅要学生说出对科学的想法,而且要求学生在测评科学素养的过程中,表达他们对测评本身的态度。PISA2006主要通过两种方式获取关于学生态度的数据资料,一种为通过调查问卷直接提出问题;另一种为情境测试题目。调查问卷收集学生对科学的兴趣,对科学探究的支持以及对资源和环境的责任感等三个方面的资料。此外,还包括学生课外参与科学活动的情况,以及从学生自己的生活和社会角度测评学生的科学价值观。
    5)量规
                能通过比较数据来评价其他观点或视角
    能详细而精确地交流科学论断和/或描述
     
                  能在推导结论或评价结论过程中的竞争性数据或推理线索中选择相关信息
     
     
                能在推导结论或评价结论中使用一般的科学知识
    PISA 2006是以能力为基础撰写评价报告的,与PISA 2006科学素养界定核心――科学能力直接相关。这不同于以知识为基础的评价报告,因为评价目标不是评价学生的知识,而是评价学生能否应用知识。如下图表示的是对学生“使用科学证据”能力的评价方式。
     
     
     
     
     
     
    3.科学素养的试题范例
    例题1:苍蝇
        一个农夫在一个农业实验站养乳牛。乳牛生活的牛棚里有很多苍蝇,以至影响到乳牛的健康。农夫就在牛棚和牛身上喷洒了杀虫剂A,结果苍蝇几乎死光了。过了一段时间,苍蝇又多起来了,农夫又喷洒了杀虫剂,效果和第1次差不多。大多数,但不是全部的苍蝇都死了。没过多久,苍蝇又多起来,农夫又喷洒杀虫剂加此反复进行了5次。但农夫发现,杀虫剂A的效果一次比一次差。农夫注意到,这些杀虫剂是一次性大批量配制的,每次喷洒的都是这些杀虫剂。这样农夫就猜测,可能是时间过久了,杀虫剂慢慢地遭到分解失效了。
        问题1:农夫猜测,时间久了,杀虫剂慢慢地遭到分解失效了。请你简要解释如何验证农夫的这个猜测。
    问题2:农夫猜测,时间久了,杀虫剂慢慢地遭到分解失效了。请你给出2个和农夫不同的解释,用来解释杀虫剂A的效果一次比一次差。
     
    问题1
    情景:社会
    能力:使用科学证据, 辨别证据
    知识:生命科学领域,物理和化学变化
     
    答案:回答中,应用了3个控制变量,即苍蝇的类型、杀虫剂使用时间、苍蝇是否接触过杀虫剂。例如,将新配制的杀虫剂和原来配制的杀虫剂,同时应用于两组类型相同,且没有接触过这种杀虫剂的苍蝇,比较它们的效果。
    编码为4(满分)的回答:在回答中应用了以上3个控制变量中的两个。例如,将新配制的杀虫剂和原来配制的杀虫剂,应用于牛棚中的苍蝇。
    编码为3的回答:在回答,中应用了以上3个控制变量中的两个。例如,对这种杀虫剂,在间隔一定时间后,进行化学分析,看看其中有没有因为时间推移而发生化学变化。
    编码为2的回答:将新配制的杀虫剂喷洒,提到和原来配制的杀虫剂进行比较。
    编码为1的回答:提到对杀虫剂进行化学分析,没有提到比较杀虫剂随时间推移的变化。或者仅仅提到将杀虫剂送到实验室化验,没有提到进行比较。
    其他回答编码为0。回答离题编码为8;空白编码为9。
     
    问题2
    情景:社会
    能力:识别问题
    知识:生命科学领域,生理变化和理化变化
     
    答案:编码为2(满分)的回答:其中一个解释提到具有抗药性的苍蝇能够生存下来,并把抗药性遗传给下一代。另一个解释可以如:环境条件的变化伯温度八杀虫剂使用方法的改变等。编码为1的回答:只提到一种解释。编码为0的回答:其他回答,如从别的地方飞来了新的苍蝇。回答离题编码为8;空白编码为9。
     
    例2 白天
    今天是北半球庆祝一年中最长的一个白天,但同时澳洲却是最短的一个白天。
    在澳洲的墨尔本市(位于赤道以南,维度38度),太阳早上7:36升起,下午5:08落下,白天有9小时32分钟。
    而南半球最长的白天预计在12月22日。那天太阳于早上5:55升起,下午8:42落下,白天有14小时47分钟。
    天文学会的韦汉斯先生说,南北半球的季节变化是与地球的轴心倾斜23度有关。
    问题1:哪一项陈述可以解释地球为什么有白天和黑夜?
    A地球沿轴心自传
    B太阳沿轴心自传
    C地球轴心是倾斜的
    D地球绕太阳公转
    问题2
    下图表示了太阳光怎样射到地球上的。
    假如今天是墨尔本最短的白天。请在图上画出地球的轴心、南半球、北半球和赤道,并在恰当的地方写上这些名称。
     
    问题1
    情景:全球的
    能力:科学解释现象
    知识:地球空间领域
     
    答案:代号1(满分)A地球沿轴心自传
          代号0(零分)其他答案
    轴心有分部分
          代号9(零分)没有做答
     
    问题2
    情景:个人的
    能力:科学解释现象
    知识:地球空间领域
     
    答案:
    注意评分时留心学生是否做到以下要求。
    1地球轴心画成向太阳倾斜,而非垂直线。倾斜度与垂直线呈10度到45度角,如下图。
    如果角度超出10度到45度范围,则无分。
    2有没有在图上标出南北半球的位置或有没有写出其中一个半球的名称(去暗示另一个半球的存在)
    3.赤道画成向太阳倾斜,而水平线。倾斜度与垂直线呈10度到45度角,如下图。
     

    可以用直线或椭圆线描绘赤道。
     
     
     
     
     
    如果角度超出10度到45度范围,则无分。
     
    太阳塔(态度测量的匹配观点例题)
     
    这里是四个人对“你支持建造太阳塔吗?”问题的回答。圈出最接近你观点的答案。
    A. 不建造。我们需要廉价的电力供应。现在担心温室效应还太早。
     答案: 反映出不关注可持续发展,而问题重点是人类要在保持自然环境可持续性发展的情况下利用资源。个体从自己与别人的关系角度来看待世界,而没有从个人与脆弱环境的关系角度来看待世界
     
    B. 不建造。应该减排温室气体,但是我要等到科学家找到更廉价的方式来生产可再生能源。
    答案:这反映出当个人面对支持或反对加强资源保护的行动时,个人认识到:自己行为会影响可持续发展,取得中短期效益的代价是牺牲了长期持续发展。其世界观比较关注短期效益。
     
    C. 建造。电力成本会更高,如果每个人都要承担减排温室气体成本的话,那么我愿意多付电费。
    答案:这反映个人知道:加强资源保护是为了后代,但是他们对资源保护的支持有限――个人单独会更容易采取支持资源保护的行动,而与他人一起会采取有条件地行动。
     
     
    D.建造。即使别人不愿意,我也将原意多付电费。我将积极鼓动他人采取行动减排温室气体。
     答案:这反映出个人对可持续发展有责任感,他们愿意从事可能加强资源保护的行为(会支持维护可持续发展的团体)。他们愿意采取独立行动,即,不以他人的行动或观点为条件。
     
     
    4 李克特式Likert-style)问卷(态度调查问卷)
    你对下列哪种任务感兴趣?
    每排中只能勾上一个选项。
    兴趣最高 兴趣较高 兴趣较低 没有兴趣
     
    a) 在解决犯罪问题时多了解DNA的用途                      □1       □2       □3      □4
    b) 多学习DNA数据工作原理                                □1       □2       □3      □4
    c) 更好地理解应用科学来解决犯罪问题的方式                  □1       □2       □3      □4
    (四)问题解决技能的界定与测评
    1.问题解决技能的界定
    PISA2003年举行的第二次测试中,在对原有三个领域测试的基础上,基于学生面对未来社会的要求,超越学科的界限,新增设了解决问题技能的测试项目,以评估学生综合解决现实生活问题的水平。
    问题解决能力是指个人通过认知过程来面对和解决现实、跨学科情境下无明显解决方法的问题的能力。问题解决能力领域已经超越了单一的数学、科学、阅读学科领域。在问题解决过程中,学生要理解给定的信息,识别关键特征(critical features)及其相互关系,构思或进行外部表征,解决问题,并对问题的解决方法进行评价、判断和交流。操作时可以从数学、科学、语言、社会科学等课程体系中找到问题的解决方法。问题解决能力是未来学习的基础,可以有效帮助学生参与社会,进行个人活动。
    PISA的问题解决不同于学科内部的问题解决,体现在以下三个方面:第一,跨学科,对跨学科问题解决能力评价重点是学生解决问题过程和解决方法的正确性;第二,现实情景,情境可能是在无学科领域,也可能是在多学科的交叉领域;第三,复杂性,评价强调复杂任务、动态过程及推理任务,强调知识的综合运用。
    由于问题的类型较多,分类一直未能统一,PISA将问题解决能力测试限定在三种问题类型中,即决策制定、系统分析设计、疑难排除。同时,将学生处在解决方案是开放的和解决过程是复杂的问题情景中,所表现出来的问题解决能力作为评价的重点。问题解决能力包括“理解给定的信息、识别关键特征及其相互关系、建构或运用外部表征、解决问题、评价判断和交流问题解决方法”等五个方面。
    2.问题解决技能的评价结构
    PISA问题解决评价试图识别在多种环境和内容领域中的问题解决过程,并对其进行描述和量化,他的评价框架由问题类型、现实生活情境、相关学科、问题解决过程、推理技能等五个方面构成(图4.1)。
     “真实生活”
     问题类型
    决策制定
    系统分析和设计
    疑难排除
    情境
    个人生活
    学校生活
    工作和休闲
    当地社区
    学校
     
    学科
    社会科学
    贸易
    数学
    科学
    文学
    项目
    解决
    问题解决过程
    理解
    叙述
    组织
    解决
    交流
    潜在能力
    分析推理
    类比推理
    定量推理
     
    图4.1 问题解决技能评价框架
    1)问题类型
    PISA 2003跨学科问题解决评价,把学生问题解决能力限制在三个问题解决的类型中,即决策制定(Decision Making),系统分析和设计(System Analysis and Design),疑难排除(Trouble Shooting)。
    决策制定问题类型要求学生在考虑特定的限制后做出决定,如决定购买哪种轿车。系统分析和设计问题类型要求学生分析复杂情境以找出要解决的问题原因,或设计一个系统以发挥作用,实现特定的目标,如夏令营如何合理安排住宿。疑难排除问题类型要求学生能找出缺点或操作系统的运行机制,如找出自行车气筒为何打不出气来。
    2)现实生活情境
    这种要素涉及了学生的问题解决经验。PISA 的问题解决评价要求学生灵活运用所学的知识和技能;在不同情境中自由切换能力类型;调节自身认知水平,运用知识来处理困境、冲突、决策和问题。OECD/PISA 2003中的问题解决情境不同于课堂情境和学校课程。因此, PISA问题使用“个人生活”、“学校生活”、“工作和休闲”、和“当地社区和学校”等情境。
    3)相关学科
    为了反映现实生活问题解决的重点,PISA问题解决领域将会覆盖数学、科学、文学、社会科学、技术、商贸等各类学科。
    4)问题解决过程
    由于每个人解决问题的方法多种多样,很难归纳出标准的格式。前述的三种问题类型的解决过程一般会涉及“理解给定的信息、识别关键特征及其相互关系、建构或运用外部表征、解决问题、评价判断和交流问题解决方法”等五个方面。
    理解给定的信息:包括学生如何理解文本并得出推论,联系各种资源的信息,理解相关概念,使用背景知识信息以理解给定的信息。
    识别关键特征及其相互关系:包括如何识别问题变量,对相关变量和不相关变量做出判断;建构假说,检索、组织、考虑和严格评价情境信息。
        建构或运用外部表征:包括学生如何建构表格、图画、符号或口头表述形式,如何运用给定的外部表征来解决问题,以及如何切换表述形式。
        解决问题:包括制定决策(在决策制定问题类型中);分析系统或设计系统来实现特定目标 (在系统分析和设计问题类型中);诊断和提出解决方法(在疑难排除问题类型中)
        评价、判断和交流问题解决方法:包括学生如何测试解决方法,寻找新信息;从不同视角来评价解决方法以重构解决方案并使其更易被接受;判断解决方法;找到合适的词语来向外界表达和交流解决方法。
    5)推理技能(潜在能力)
    问题解决过程中涉及的分析推理、类比推理、定量推理及批判性思考能力。虽然阅读、数学和科学能力领域也需要这种思考和推理能力,但两者指向不同:阅读、数学和科学能力领域的问题场景,重在运用过程来获得相关领域的知识;问题解决的重点是问题解决过程的本身,如何综合运用、慎密思考。
    6)试题类型
    为了充分地测量和描述学生的行为,必须要测试学生在自由问答和目标明确的问题背景下的思维形式。因此,PISA 2003跨学科问题解决评价中,采用多种评价测试题的形式。评价形式包括:较短封闭式测试题(short closed response items)、较短开放式测试题(short open constructed response items)、较长开放式测试题(long open constructed response items),以及多项选择测试题(multiple choice items)。
    7)量规
    在问题解决总体框架中建立整体性评价量规,以评价学生对测试题的回答。在这样的量规中,一般采用五级计分:最高级别的计分,表明该学生的行为反映了其能够完全正确地理解问题,问题解决的方法也是清晰、恰当的,并进行了充分的展开;回答逻辑正确,书写清楚,没有错误;例子选择合适,并对其进行了充分展开。第二级的计分中,学生的行为表明了其对问题理解较清晰,也有可接受的问题解决方法,但是在展开回答时有些小错误;也有举例,但是没有对其进行充分展开。第三级的计分中,学生的行为反映了其理解了问题中的概念,问题解决方法和表述方式有逻辑性;但是,总体上回答并没有充分展开;推理中会存在严重逻辑错误或缺点,回答中只有部分正确合理;所举的例子不正确或不恰当。第四级的计分中,学生行为表明了其对所提问题理解较少,而且没有提出可行的问题解决方法;少量的正确行为有逻辑性,回答不完整,推理中有严重错误;这个层次的问题回答没有举例。最低的级别是零分级别,回答完全不正确或不相关。在该层次中,要么是不正确、不相关的回答,要么是空白,反映测试时间不充分或思路不对。
    当然,不是每个测试题都有上述五个层次,但是整个问题解决测试中,学生的表现会有不同的层次。
     
    3.问题解决技能的试题范例
    例题看电影
    Issaac,15岁,想和他的两个朋友一起去看电影,这两个朋友与他同龄,他们有一周的假期。假期时间:3月24日(星期六)至4月1日(星期天)结束。Issaac向两个朋友询问看电影的合适日期和外出时间。以下是他获得的信息:
    Fred:我星期一必须呆在家里,星期三下午2:30到3:30练习音乐。
    StanIey:我星期天必须去看我的外婆,我已经看过Pokamin,不想再看一遍。
    Issaac的父母坚持认为他们只能去看适合他们年龄的电影,不能自己走回家。晚上10点之前的任何时间可以来接他们。
    Issaac核对了电影的放映时间,这是他们获得的信息:
     
    荷里活戏院
    订票电话:2603 5336
    24小时查询电话:2603 5555
    逢星期二票价优惠:所有电影每场$40
    未来两星期上映的电影(由323日星期五开始起计)
    电脑神童
     
    片长113分钟
    1400(星期一至五)
    2135(星期六/)
     
     
    适合12岁及以上孩子观看
    百变精灵
     
    片长105分钟
    1340(每天)
    1635(每天)
     
     
    家长指引类别,适合所有人士观看,但部分镜头不适合幼儿观看
    怪兽森林
     
    片长164分钟
    1955(星期六/)
     
     
    适合18岁及以上的人士观看
    小小特攻队
     
    片长144分钟
    1500(星期一至五)
    1800(星期六/)
     
     
    适合12岁及以上人士观看
    食肉兽
     
    片长148分钟
    1830(每天)
     
     
    适合18岁及以上的人士观看
    森林之王
     
    片长118分钟
    1435(星期一至五)
    1850(星期六/)
     
     
    适合所有年龄的人观看
    问题1:根据Issaac获得的电影放映信息,他询问同学获得的信息,lssae和他的两个朋友六部电影中可以观看电影有哪些?
    问题2:如果三个孩子决定去看“电脑神童”这部电影,哪个时间合适?
     
    问题类型:决策制定
    生活情景:工作和休闲
    问题解决过程:理解给定信息,识别关键特征及其相互关系、解决问题
    推理能力:分析推理
     
    例题2 夏令营宿营
    Eedish社区服务部正在组织一个5天的儿童夏令营。有46个孩子(26个女孩,20个男孩)签约,8个成人(4男4女)自愿参加并组织这次夏令营。
    1 参与宿营的成人                          宿舍情况
    Mrs Madison
     
     
    名称
    床位数
    Mrs Carroll
     
     
    红色
    12
    Ms Grace
     
     
    蓝色
    8
    Ms Kelly
     
     
    绿色
    8
    Mr Stevens
     
     
    紫色
    8
    Mr Neill
     
     
    橙色
    8
    Mr Williams
     
     
    黄色
    6
    Mr Peters
     
     
    白色
    6
     
    宿舍守则:
     
    1. 男孩子和女孩子必须住在不同的宿舍
    2. 每间宿舍至少要有一个成年人
    3. 成年人必须和相同性别的孩子住在一起
     
     
     
     
     
     

    问题1:按照宿舍守则,如何将46个孩子和8个成人分配在合适的宿舍里?
     
    问题类型:系统分析和设计
    生活情景:工作和休闲
    问题解决过程:理解给定信息,识别关键特征及其相互关系、建构或运用外部表征、解决问题
    推理能力:分析推理、定量推理
     
    例题3 灌溉
    下图是一个灌溉渠道系统(闸门和河道),用以把水送到田地的不同部分。水闸A至H可以被打开或关上,以便让水流到需要灌溉的地方。当水闸门关上,水就无法流过
     
     
     
     
     
     
    图1 灌溉渠道系统
    问题1:小强用表1的设定去测试水闸的情况
    表1 水闸的开关设定
    A
    B
    C
    D
    E
    F
    G
    H
    打开
    关闭
    打开
    打开
    关闭
    打开
    关闭
    打开
     
    请按表1的开关设定,在下图中画出所有可能的水流路线。假定所有水闸都能根据设定正常工作。
     
     
     
     
     
     
     

    问题2:小强发现,按表1安排设定水闸的开关后,并没有水流出系统。这表示至少有一个水闸闭塞了。判断下列问题:
    在下列情况下,水会不会流出系统?
    情况
    水流不流出系统?圈出你的选择
    水闸A闭塞了。其他水闸按表1设定正常工作。
    水会流出系统/水不会流出系统
    水闸D闭塞了。其他水闸按表1设定正常工作。
    水会流出系统/水不会流出系统
    水闸F闭塞了。其他水闸按表1设定正常工作。
    水会流出系统/水不会流出系统
     
    问题3:小强想找出测试水闸D是否闭塞的方法。
    试在下表中设计一套水闸开关设定,用来测试以下情况:当D水闸设定为打开时,它是否闭塞。
    水闸开关的设定(在空格处填写“打开”或“关闭”)
    A
    B
    C
    D
    E
    F
    G
    H
     
     
     
     
     
     
     
     
     
    问题类型:疑难排除
    生活情景:当地社区
    问题解决过程:全部五项能力
    推理能力:分析推理、批判性思维
    五、国际学生评价计划(PISA)对评价改革的启示
    (一)评价改革应有明确的价值取向
    PISA是以大规模的跨国研究计划(DeSeCo6年研究所提出的《能力的界定与遴选:理论框架与概念基础》为基础的,聚焦学生现实生活和终身学习所必须的知识和技能,具有十分清晰的价值取向。因此,评价改革应首先从评价的目的着手,提出有利于学生发展的价值取向。
    (二)评价改革应有系统的设计
    PISA之所以在短短的几年时间内得到广泛的重视,一个重要的原因是评价经过了十分严密的系统设计,包括目的、框架、方法、解释等一套完成的体系。因此一个好的评价,应当严格地审视自己的评价系统。
    (三)评价改革应着眼学生未来的发展
    PISA有一个显著的特征,就是关注学生终身发展,更多着眼于学生未来发展所需要知识和能力的应用水平,因此,PISA在评价过程中特别强调真实情景、知识运用、思维能力,不去测试那些死记硬背知识,那是没有意义的。因此,评价改革应当改变过于关注学生掌握教科书知识内容的倾向,将关注点应落在关注未来发展潜能、兼顾考察现实水平这一层面上。
    主要参考文献
    [1]滕梅芳.为生存而学习――国际学生评价项目(PISA)的框架研究及其启示.硕士论文
    [2]滕梅芳 盛群力.勾勒关键能力,打造优质生活――OECD关键能力框架概述.译稿
    [3]曹宝龙.国际测试PISA 和PISA2006 科学测试.译稿
    [4]亓永平.PISA:全球性学生素质评价.全球教育展望.2002(10)
    [5]王连照 田慧生.国际学生阅读能力评价旨趣与过程.比较教育研究.2007(8)
    [6]卧松.欧盟提出终身学习八大关键能力.素质教育大参考.2007(4A)
    [7]李广.为生存而学习――PISA评价思想价值取向研究.外国教育研究.2005(7)
    [8]周琴. PISA2003对学生学业成绩的测评、分析及其启示.上海教育科研.2006(9)
    [9]尹雨.为学习再阅读――经合组织国际学生评估项目(PISA)阅读能力评介.中学语文教学.2005(5)
    [10]王唏 黄慧娟 许明.PISA:阅读素养的界定与测评.上海教育科研.2003(9)
    [11]苏玫.PISA中的数学素养评价.现代教学.2006(6)
    [12]黄慧娟 王唏.PISA:数学素养的界定与测评.上海教育科研.2003(12)
    [13]王唏 黄慧娟 许明.PISA:科学素养的界定与测评.上海教育科研.2004(4)
    [14]张海和.OECD/PISA研究中科学素养的涵义及其理论基础.生物学通报.2005(6)
    [15]张海和.OECD/PISA研究中科学素养评价的内容.生物学通报.2005(7)
    [16]张海和.PISA科学素养评价的作业样本和评分系统.生物学通报.2005(8)
    [17]王唏 黄慧娟 许明.PISA:科学素养的界定与测评.上海教育科研.2004(4)
    [18]邝伟良.科学教育新课程、世界科学教育趋势与PISA.香港数理教育学会通讯.2003(11)
    [19]王唏 李素芳.PISA:解决问题技能的界定与测评.上海教育科研.2006(9)
    [20] 李毓秋 严云堂.人力资本测量与教育质量监控――国际学生评价项目PISA及其对我国教育质量监控的启示.维普资讯 http://www.cqvip.com
    [21]孔凡哲 李清 史宁中.PISA对我国中小学考试评价与质量监控的启示.外国教育研究.2005(5)
    [22]林瑾娜 许明.评价促进学习.全球教育展望.2007(6)
     
    [31] OECD; PISA 2006 Results [M]; 2007
     

重庆市教育评估院 重庆市基础教育质量监测中心
电话:023-67001769/67715619/67716119 传真:023-67006145
网址:http://cee.gov.cn 电子邮箱:cqspgy@126.com
地址:重庆市江北区欧式一条街兴隆路20号 邮编:400020
渝ICP备12008056号-2