Tipos de conceito de reforço e índices de reforço
Skinner, ao lidar com respostas operantes, dirá: "Um operante é uma parte identificável do comportamento da qual ele pode ser dito, não que é impossível encontrar um estímulo que o provoque (...) mas, nas ocasiões em que sua ocorrência é observada , nenhum estímulo correlacionado pode ser detectado.
O formulador da lei do efeito foi E. L. Thorndike (1874-1949). Thorndike argumenta que naquelas situações em que o desaparecimento de uma estimulação aversiva produz um estado "satisfatório", os efeitos reforçadores desse tipo de situação devem ser interpretados como a primeira formulação da lei do efeito; isto é, aqueles em que o desaparecimento da estimulação aversiva é recompensadora, devem ser interpretados como uma busca no desaparecimento dessa estimulação..
Você também pode estar interessado: Conceito e Teorias do Índice de Motivação- Introdução ao problema de reforço
- Conceitos básicos, tipos de reforço
- Índices de reforço
- Relacionamentos empíricos com reforço positivo
Introdução ao problema de reforço
Para o próximo fato, vamos chamá-lo de lei empírica do efeito: empiricamente, a conseqüência que uma resposta traz consigo é um poderoso determinante de se a resposta será corrigida ou não B.F. Skinner (1904) tem sido o que mais sistematicamente tem se empenhado em tirar o máximo proveito da formulação empírica da lei do efeito desde o final da década de 1930, com uma posição teórica que às vezes tem sido descrita como "empirismo descritivo sistemático". Comportamento voltado "respondente" (controlado pelo condicionamento clássico), Skinner propõe a "operante", emitida pelo organismo espontaneamente. A abordagem de Skinner para o problema do reforço não é teórico no sentido tradicional, mas empírico-descritivo.
No nível descritivo, alguns eventos que seguem as respostas têm o efeito de aumentar a probabilidade de que essas respostas se repitam. Esses eventos são definidos e identificados como reforçadores ou reforçadores, dependendo de seus efeitos observáveis e não dependendo do efeito que possam ter sobre os mecanismos e processos "internos" do organismo, sejam eles neuronais ou não. Esses eventos, chamados reforçadores ou reforçadores, podem ser de dois tipos:
- Reforço positivo: "Aquele cuja presença fortalece ou aumenta a probabilidade de que uma ação apareça no futuro".
- Reforço Negativo: "Aquele cujo desaparecimento fortalece ou aumenta a probabilidade de que uma ação apareça no futuro (apenas a que esteve relacionada ou com o desaparecimento da estimulação aversiva)".
Tanto em Skinner quanto em Thorndike, a ação do reforço é automática e, em princípio, fora da atividade consciente e / ou consciente do organismo. O reforço age automaticamente.
Conceitos básicos, tipos de reforço
É estudado como um evento que aparece espontaneamente com uma determinada frequência. "As respostas do operador podem ser divididas em instrumental e consumatório:
- Resposta instrumental: "Quando é realizado por uma organização e visa alcançar um objetivo".
- Respostas Consutórias: "As respostas que um organismo justo faz na conquista do objetivo (comer, copular, beber, etc.)".
Para realizar a análise das respostas, estamos interessados em distinguir dois conceitos:
- Taxa: É o número de respostas dadas por unidade de tempo e é normalmente apresentado por gradientes de aquisição ou extinção (diz-se que uma resposta tem uma taxa ou um gradiente mais acelerado ou mais pronunciado do que outro).
- Nível de resposta assíncrona: É o nível máximo de aquisição e isso não aumenta com tentativas subseqüentes.
Outra divisão que podemos fazer sobre reforços é esta:
- Reforços primários: Aqueles que têm um valor reforçador biologicamente determinado e não aprendendo, como acontece no caso do ar, comida e bebida.
- Reforços Secundários: Aqueles que adquiriram seu valor aprendendo como recompensa social (louvor) ou dinheiro.
Condicionamento instrumental Existem quatro tipos de condicionamento instrumental (um positivo e três negativos)
O treinamento de recompensa: O reforço utilizado é positivo e não está presente antes da realização da resposta desejada. Assim que a resposta aparecer, o reforço é aplicado. Por exemplo: toda vez que um rato pressionava uma alavanca, uma pílula ou um grão de alimento era apresentado em uma cânula..
Treinamento de punição: O reforço (estímulo punitivo) não está presente. Se o sujeito executa uma ação prefixada, aparece o reforço negativo (estímulo punitivo). P. ejem: Um filho de cinco anos quebra um vaso valioso para a mãe e ela lhe dá uma bofetada.
Os desenhos de evitação: O reforço aversivo está ausente antes da realização do comportamento, a realização da resposta apropriada implica que o reforço não ocorra. P. ejem: Projeto de esquiva de Sidman no qual a aplicação de um choque elétrico é programada em uma caixa de Skinner a cada 5 segundos, a menos que o animal (geralmente um rato) aperte uma alavanca. A resposta de pressionar a alavanca desconecta o circuito e o animal não recebe o choque.
Os desenhos de fuga: O reforço aversivo está presente antes da realização da resposta, a realização desta resposta implica o desaparecimento da estimulação aversiva. P. ejem: Em uma caixa de transporte o animal está em um compartimento com grade eletrificada, choque elétrico aparece e a resposta do animal (pulando a barreira que separa os dois compartimentos) envolve a eliminação da estimulação aversiva.
Índices de reforço
Índices de reforço Os índices de reforço são referidos às formas de apresentação desses reforços em um experimento. Nós podemos dividi-los em:
Índices não intermitentes: A aplicação contínua de reforços para cada resposta que aparece (se adquire ou se extingue).
- Reforço Contínuo: Cada resposta emitida por um organismo é reforçada.
- Extinção: Nenhuma resposta é reforçada e é um processo semelhante ao da extinção experimental no condicionamento clássico.
Índices intermitentes: A aplicação de menos volume ou número de reforços do que as respostas feitas. Por razões de espaço, apenas comentaremos sobre os índices intermitentes simples; Estes são índices relacionais entre respostas e reforços ou entre tempo e reforço. No caso de levar em conta o número de respostas, falamos de um índice de razão e se um período temporário é levado em conta, falamos de um índice de intervalo.
- Índice de taxa fixa (RF): A resposta correta dada pelo organismo é reforçada, depois de ter feito um certo número deles.
- Índices de razão variável (RV): Ao contrário do caso anterior, a taxa de resposta / reforço é uma série aleatória em torno de um valor central e com um pequeno intervalo de variação.
- Índices de intervalo fixo (IF): A primeira resposta correta que aparece após um determinado intervalo de tempo é reforçada (geralmente em minutos).
- Índice de intervalo variável (IV): Os reforços são apresentados de acordo com uma série aleatória de intervalos de tempo e apenas o intervalo médio é explicitado.
Relacionamentos empíricos com reforço positivo
Uma das principais teorias sobre a extinção é a extinção como interferência de respostas. Nessas teorias, a ideia básica é que "o extinção não ocorre devido a uma inibição e / ou supressão de respostas, mas porque o sujeito aprende resposta alternativa que interfere ou compete com o anterior. "A alternativa teórica mais comum é a chamada hipótese da frustração..
A ideia central é que, durante o período de aquisição, o sujeito aprenda a resposta apropriada e, além disso, espere a recompensa que segue a resposta. No processo de extinção, a experiência de não receber a recompensa é o que produz frustração. Essa frustração seria responsável pelo assunto empenhar-se na realização de outras respostas. Através de várias demonstrações experimentais, verificou-se que:
- A frustração resultante de respostas não positivas atua positivamente como energizador do comportamento.
- Existe um relação direta entre a quantidade de frustração (medida em critérios como velocidade de corrida) e a redução de recompensa correspondente a essa tentativa.
- Existe uma relação entre a intensidade da frustração, o atraso no recebimento da recompensa e o número de tentativas de aquisição.
- A frustração tem componentes aversivos, de modo que alguns autores a assimilaram desenhos de punição.