Ch.4 学习与人类后天发展

核心概念

经典条件反射为联结式学习提供了解释，即一个能够印发内在反射的刺激如何与另一个先天中兴的刺激建立联结，使得后者能印发与前者相同的反应

在操作性条件反射中，某一行为印发的奖赏和惩罚登后果影响着该行为再次出现的概率

在认知心理学看来，某些形式的学习只能解释为心理过程的改变，而不仅仅是行为本身的改变

kkk>在认知心理学看来，某些形式的学习只能解释为心理过程的改变，而不仅仅是行为本身的改变

行为学习的两个重要形式

经典条件反射
操作性条件反射

经典条件反射

经典条件反射的要素
- 反射
  - [[#^6f3694|条件反射]]（Conditioned Response, CR）
  - 非条件反射（亦称非条件反应，Unconditioned Response, UCR）
- 中性刺激（Neutral Stimulus, NS）
  - 即不能诱发反射的刺激
- 非条件刺激（Unconditioned Stimulus, UCS）
- 习得
  - 通过“学习”使原本的中性刺激转变为能够触发反应的条件刺激（Conditioned Stimulus）的过程
  - 这一过程通常需要将中性刺激与原有的非条件刺激相匹配
  - 经条件刺激触发的反应称为条件反射 ^6f3694
- 消退（extinction）
- 自发恢复（spontaneous recovery）
- 刺激泛化（stimulus generalization）
- 刺激辨别（stimulus discrimination）
- 高阶条件反射
  - 条件刺激作为中介，多米诺骨牌一样地层层引发反应
经典条件反射的应用

[!注意] UCS和UCR之间的连接是“内嵌的”，不涉及学习

操作性条件反射

经典条件反射理论无法应用于自主的行为，而且奖励和惩罚在经典条件反射理论中也不起作用

斯金纳与激进行为主义
- 强调“对行为最强有力的影响是其后果”
- 效果律（law of effect）
强化（reinforecement）
- 强化物
  - 初级强化物 primary reinforcer
    - 直接作用于生物机体，对生物的某种技能产生作用的强化物
    - 食物、水、发生性的机会
  - 次级强化物 secondary reinforcer
    - 通过初级强化物间接产生影响的强化物，也称为条件强化物
    - 赞美、认可、金钱
- 正强化和负强化
- 连续与间歇强化
  - 连续强化指每一次做出期望行为时都给予正强化物
  - 间歇强化就是间歇强化
  - 间歇强化更有助于抵抗消退
  - 将社会强化和更有形的奖赏相结合能有助于向着间歇强化过渡
- 两种强化程序
  - 比率强化程序 ratio schedule
    - 是什么
      - 指奖赏取决于正确反映的数量
    - 进一步分类
      - 固定比率
        
        是什么
        
        在固定数量的（正确？）反应后提供强化
        
        注意这里的强化物的量并不要求是固定的
        
        应用场景
        
        计件工资
        
        满十送一
      - 可变比率
        
        是什么
        
        在随机数量的反应后提供强化
        
        场景
        
        对于电话推销员来说，打电话的次数和获得订单之间并非以一个固定比率正相关
        
        可变比率更加能够激发反应，亦即让对象更多地做出反应
  - 间隔强化程序 interval schedule
    - 是什么
      - 强化取决于特定时间段内的反应
    - 进一步分类
      - 固定间隔
        
        反应速率最低
      - 可变间隔
- 惩罚与负强化的区别，以及惩罚有用吗

![[image001.gif]]

如何区分经典条件反射和操作性条件反射

理论	反应发生时机	反应自主性	反应新旧
经典条件反射	刺激之后	反射性的	现有行为
操作性条件反射	刺激之前	自主的	新型为