Tipos de conceito de reforço e índices de reforço

Tipos de conceito de reforço e índices de reforço / Psicologia básica

Skinner, ao lidar com respostas operantes, dirá: "Um operante é uma parte identificável do comportamento da qual ele pode ser dito, não que é impossível encontrar um estímulo que o provoque (...) mas, nas ocasiões em que sua ocorrência é observada , nenhum estímulo correlacionado pode ser detectado.

O formulador da lei do efeito foi E. L. Thorndike (1874-1949). Thorndike argumenta que naquelas situações em que o desaparecimento de uma estimulação aversiva produz um estado "satisfatório", os efeitos reforçadores desse tipo de situação devem ser interpretados como a primeira formulação da lei do efeito; isto é, aqueles em que o desaparecimento da estimulação aversiva é recompensadora, devem ser interpretados como uma busca no desaparecimento dessa estimulação..

Você também pode estar interessado: Conceito e Teorias do Índice de Motivação
  1. Introdução ao problema de reforço
  2. Conceitos básicos, tipos de reforço
  3. Índices de reforço
  4. Relacionamentos empíricos com reforço positivo

Introdução ao problema de reforço

Para o próximo fato, vamos chamá-lo de lei empírica do efeito: empiricamente, a conseqüência que uma resposta traz consigo é um poderoso determinante de se a resposta será corrigida ou não B.F. Skinner (1904) tem sido o que mais sistematicamente tem se empenhado em tirar o máximo proveito da formulação empírica da lei do efeito desde o final da década de 1930, com uma posição teórica que às vezes tem sido descrita como "empirismo descritivo sistemático". Comportamento voltado "respondente" (controlado pelo condicionamento clássico), Skinner propõe a "operante", emitida pelo organismo espontaneamente. A abordagem de Skinner para o problema do reforço não é teórico no sentido tradicional, mas empírico-descritivo.

No nível descritivo, alguns eventos que seguem as respostas têm o efeito de aumentar a probabilidade de que essas respostas se repitam. Esses eventos são definidos e identificados como reforçadores ou reforçadores, dependendo de seus efeitos observáveis ​​e não dependendo do efeito que possam ter sobre os mecanismos e processos "internos" do organismo, sejam eles neuronais ou não. Esses eventos, chamados reforçadores ou reforçadores, podem ser de dois tipos:

  • Reforço positivo: "Aquele cuja presença fortalece ou aumenta a probabilidade de que uma ação apareça no futuro".
  • Reforço Negativo: "Aquele cujo desaparecimento fortalece ou aumenta a probabilidade de que uma ação apareça no futuro (apenas a que esteve relacionada ou com o desaparecimento da estimulação aversiva)".

Tanto em Skinner quanto em Thorndike, a ação do reforço é automática e, em princípio, fora da atividade consciente e / ou consciente do organismo. O reforço age automaticamente.

Conceitos básicos, tipos de reforço

É estudado como um evento que aparece espontaneamente com uma determinada frequência. "As respostas do operador podem ser divididas em instrumental e consumatório:

  • Resposta instrumental: "Quando é realizado por uma organização e visa alcançar um objetivo".
  • Respostas Consutórias: "As respostas que um organismo justo faz na conquista do objetivo (comer, copular, beber, etc.)".

Para realizar a análise das respostas, estamos interessados ​​em distinguir dois conceitos:

  1. Taxa: É o número de respostas dadas por unidade de tempo e é normalmente apresentado por gradientes de aquisição ou extinção (diz-se que uma resposta tem uma taxa ou um gradiente mais acelerado ou mais pronunciado do que outro).
  2. Nível de resposta assíncrona: É o nível máximo de aquisição e isso não aumenta com tentativas subseqüentes.

Outra divisão que podemos fazer sobre reforços é esta:

  1. Reforços primários: Aqueles que têm um valor reforçador biologicamente determinado e não aprendendo, como acontece no caso do ar, comida e bebida.
  2. Reforços Secundários: Aqueles que adquiriram seu valor aprendendo como recompensa social (louvor) ou dinheiro.

Condicionamento instrumental Existem quatro tipos de condicionamento instrumental (um positivo e três negativos)

O treinamento de recompensa: O reforço utilizado é positivo e não está presente antes da realização da resposta desejada. Assim que a resposta aparecer, o reforço é aplicado. Por exemplo: toda vez que um rato pressionava uma alavanca, uma pílula ou um grão de alimento era apresentado em uma cânula..

Treinamento de punição: O reforço (estímulo punitivo) não está presente. Se o sujeito executa uma ação prefixada, aparece o reforço negativo (estímulo punitivo). P. ejem: Um filho de cinco anos quebra um vaso valioso para a mãe e ela lhe dá uma bofetada.

Os desenhos de evitação: O reforço aversivo está ausente antes da realização do comportamento, a realização da resposta apropriada implica que o reforço não ocorra. P. ejem: Projeto de esquiva de Sidman no qual a aplicação de um choque elétrico é programada em uma caixa de Skinner a cada 5 segundos, a menos que o animal (geralmente um rato) aperte uma alavanca. A resposta de pressionar a alavanca desconecta o circuito e o animal não recebe o choque.

Os desenhos de fuga: O reforço aversivo está presente antes da realização da resposta, a realização desta resposta implica o desaparecimento da estimulação aversiva. P. ejem: Em uma caixa de transporte o animal está em um compartimento com grade eletrificada, choque elétrico aparece e a resposta do animal (pulando a barreira que separa os dois compartimentos) envolve a eliminação da estimulação aversiva.

Índices de reforço

Índices de reforço Os índices de reforço são referidos às formas de apresentação desses reforços em um experimento. Nós podemos dividi-los em:

Índices não intermitentes: A aplicação contínua de reforços para cada resposta que aparece (se adquire ou se extingue).

  1. Reforço Contínuo: Cada resposta emitida por um organismo é reforçada.
  2. Extinção: Nenhuma resposta é reforçada e é um processo semelhante ao da extinção experimental no condicionamento clássico.

Índices intermitentes: A aplicação de menos volume ou número de reforços do que as respostas feitas. Por razões de espaço, apenas comentaremos sobre os índices intermitentes simples; Estes são índices relacionais entre respostas e reforços ou entre tempo e reforço. No caso de levar em conta o número de respostas, falamos de um índice de razão e se um período temporário é levado em conta, falamos de um índice de intervalo.

  1. Índice de taxa fixa (RF): A resposta correta dada pelo organismo é reforçada, depois de ter feito um certo número deles.
  2. Índices de razão variável (RV): Ao contrário do caso anterior, a taxa de resposta / reforço é uma série aleatória em torno de um valor central e com um pequeno intervalo de variação.
  3. Índices de intervalo fixo (IF): A primeira resposta correta que aparece após um determinado intervalo de tempo é reforçada (geralmente em minutos).
  4. Índice de intervalo variável (IV): Os reforços são apresentados de acordo com uma série aleatória de intervalos de tempo e apenas o intervalo médio é explicitado.

Relacionamentos empíricos com reforço positivo

Uma das principais teorias sobre a extinção é a extinção como interferência de respostas. Nessas teorias, a ideia básica é que "o extinção não ocorre devido a uma inibição e / ou supressão de respostas, mas porque o sujeito aprende resposta alternativa que interfere ou compete com o anterior. "A alternativa teórica mais comum é a chamada hipótese da frustração..

A ideia central é que, durante o período de aquisição, o sujeito aprenda a resposta apropriada e, além disso, espere a recompensa que segue a resposta. No processo de extinção, a experiência de não receber a recompensa é o que produz frustração. Essa frustração seria responsável pelo assunto empenhar-se na realização de outras respostas. Através de várias demonstrações experimentais, verificou-se que:

  1. A frustração resultante de respostas não positivas atua positivamente como energizador do comportamento.
  2. Existe um relação direta entre a quantidade de frustração (medida em critérios como velocidade de corrida) e a redução de recompensa correspondente a essa tentativa.
  3. Existe uma relação entre a intensidade da frustração, o atraso no recebimento da recompensa e o número de tentativas de aquisição.
  4. A frustração tem componentes aversivos, de modo que alguns autores a assimilaram desenhos de punição.