Hvis du ikke kan lide konsekvenserne af en handling, du har foretaget, er det mindre sandsynligt, at du gør det igen, og hvis du kan lide konsekvenserne, er det mere sandsynligt, at du gør det igen. Det er præmissen for B.F. Skinners operante betingning: en type læring, der former adfærd eller betingede reflekser gennem belønning eller straf.
Skinner mente, at det tidligere dominerende felt inden for menneskelig adfærd, altså klassisk (eller pavloviansk) betingning, hvor ufrivillige reaktioner kan udløses af gentagen eksponering for associationer (Pavlovs klokke), var for forenklet til at være en fuldstændig forklaring på kompleks menneskelig adfærd. Med udgangspunkt i Edward Thorndikes arbejde og den tro, at man skulle se på årsagerne til en handling og dens konsekvenser, satte Skinner sig for at udføre en række eksperimenter, han kunne observere, i stedet for at stole på hypoteser.
Disse eksperimenter førte til, at han i sidste ende kunne få dyr til at gøre alle mulige mærkelige ting, som at få duer til at dreje 360 grader og “læse” engelsk. Hans mest berømte eksperiment blev “Skinner Box“-eksperimentet fra 1948, hvor han placerede en sulten rotte i en kasse med et håndtag ved siden, og hver gang rotten stødte ind i håndtaget, faldt der foder ned i en beholder. Efter flere tests lærte rotten, at når den kom ind i kassen, skulle den løbe direkte mod håndtaget og trykke ned for at få mad. Ligeledes lærte rotten i en anden kasse, der gav rotten små elektriske stød, at bruge håndtaget til at få elektriciteten til at stoppe.
Skinner brugte disse eksperimenter til at bevise, at dyr, inklusive mennesker, alle er underlagt den samme “udvælgelse gennem konsekvenser”-proces, og han kunne lide at forklare det med evolutionære udtryk. Naturen tester forskellige former tilfældigt, og hvis formerne medfører gode konsekvenser, som f.eks. overlevelse, beholder naturen dem. Men hvis formerne medfører dårlige konsekvenser, som f.eks. død, slipper naturen af med dem. Da de organismer, der er udstyret med de mest optimale former, har en større chance for at overleve og dermed reproducerer mere, fører det til flere kopier af disse former i efterfølgende generationer, indtil de til sidst bliver til stede i hele den reproduktive population. Ved at holde sig til det, der virker, udleder naturen orden fra kaos og skaber komplekse selvbevarende systemer. Naturen har ikke en forudfattet bias til at designe disse former, og den har heller ikke evnen til at forudsige, hvad der vil virke på forhånd.
Når handlinger producerer positive konsekvenser, såsom gavn, nydelse osv., ændres hjernen og dens psykologi på en måde, der får den til at engagere sig i dem oftere, og når handlingerne producerer negative konsekvenser, såsom skade, smerte osv., ændres hjernen og dens psykologi på en måde, der får den til at afstå fra dem i fremtiden.
Skinner fandt ud af, at for at betinge et dyr til en bestemt adfærd, spillede konsistensen og timingen af forstærkningen en afgørende rolle. Hvis forstærkningen stoppede, ville den betingede adfærd til sidst forsvinde, hvilket han kaldte “udryddelse”. Pavlov observerede det samme: hvis sammenhængen mellem klokken og ankomsten af foder ikke blev opretholdt over tid, ville Pavlovs hunde holde op med at savle som reaktion på klokken.
Skinner fandt også ud af, at den anvendte type forstærkning kan påvirke adfærdens styrke og vedholdenhed. Brug af en kraftigere forstærkning, såsom en større madbelønning, ville have en stærkere effekt end en svagere forstærkning. Desuden skal forstærkningen forekomme kort tid efter eller umiddelbart efter en ønsket adfærd.
Sammen med klassisk betingning er operant betingning uden tvivl den vigtigste adfærdsmæssige mentale model, der findes, fordi den danner grundlag for studiet af incitamenter. Udover at forklare ligefrem adfærd, som f.eks. hvorfor du træner din hund med godbidder, eller hvorfor du besluttede dig for at ryge som teenager (for at være sammen med de seje mennesker, altså belønningen), men stoppede (fordi du blev opdaget af læreren, og dine forældre blev involveret, altså straffen), rækker dens implikationer langt bredere, ligesom din fordel i livet, hvis du ved, hvordan det flyder gennem forskellige discipliner. Den menneskelige hjerne, argumenterede Skinner, er blot en mere avanceret version af hjernen hos andre typer organismer. Som investor kan du her se, hvordan du kan anvende Skinners arbejde til at forstå markedsadfærd og dig selv.
Gambling og investering
Da gambling, defineret som at tage et væddemål med nul eller negativt forventet afkast, er en irrationel adfærd, har psykologer længe kæmpet med spørgsmålet om, hvorfor mennesker bliver afhængige af det. Maslow så hasardspil som et middel til at opfylde grundlæggende menneskelige behov som spænding og selvrealisering. Freud så hasardspil som en måde for folk at opleve en følelse af kontrol og beherskelse af tilfældigheder.
Skinners forklaring var bedre. Under sine dueeksperimenter fandt Skinner ud af, at variabel forstærkning, hvor belønningen ikke blev givet hver gang, men med jævne mellemrum, var nok til at holde duerne i gang med at gøre, hvad Skinner ønskede. Ifølge Skinner spiller folk, fordi de har været udsat for en sådan variabel forstærkning, hvor belønningen ikke er kommet ved hvert væddemål, men bare med jævne mellemrum, og med mulighed for en lejlighedsvis stor belønning, at det efterlader en tilstrækkelig forbindelse i hjernen til at fortsætte med at spille. Hvis man helt fjernede forstærkningen, ville spillelysten til sidst forsvinde, omend gradvist.
Du kan måske se, hvordan dette også gælder for forståelsen af aktiemarkedets adfærd. Der findes utallige historiske eksempler på, hvordan investeringsappetitten følger markedets retning, og operant betingning forklarer hvorfor. Når du er en ny investor, er det, markedet kaster efter dig, sandsynligvis det, du vil blive betinget til at opfatte markedet som. Hvis du hopper med på et bullmarked, vil det at tjene penge konsekvent forstærke din appetit på mere, indtil den når det punkt, hvor du måske tror, du er klogere, end du er. Tværtimod vil dårlige investeringer og erfaringer i et hårdt marked fra starten få dig til at blive modvillig til at investere og se aktier som risikable.
Peter Lynch har en “cocktail party”-teori, hvor han forklarer fra første hånd, hvordan lægmandens interesse for aktiemarkederne er direkte korreleret med markedets prisniveau:
I den første fase af et opadgående marked har markedet været nede i et stykke tid, og ingen forventer, at det stiger igen. Folk taler ikke om aktier. Faktisk, hvis de spørger mig, hvad jeg laver, og jeg svarer: “Jeg forvalter en aktiefond”, nikker de høfligt og går væk. Når ti personer hellere vil tale med en tandlæge om plak end med forvalteren af en aktiefond om aktier, er det sandsynligt, at markedet snart vil vende opad.
I fase to, efter jeg har indrømmet, hvad jeg laver til daglig, bliver de nye bekendtskaber lidt længere, måske længe nok til at fortælle mig, hvor risikabelt aktiemarkedet er, før de går hen for at tale med tandlægen. Festen handler stadig mere om plak end om aktier. Markedet er steget med 15% fra fase et, men få er opmærksomme.
I fase tre er markederne steget markant fra bunden. En flok interesserede ignorerer tandlægen og cirkler omkring mig hele aftenen. En række entusiastiske personer trækker mig til side for at spørge, hvilke aktier de skal købe. Selv tandlægen spørger mig, hvilke aktier han skal købe.
I fase fire oplever markederne en non-stop opadgående trend. Endnu engang stimler de sammen omkring mig, men denne gang er det for at fortælle mig, hvilke aktier jeg skal købe. Selv tandlægen har tre eller fire tips, og i løbet af de næste par dage slår jeg hans anbefalinger op i avisen, og de er alle steget. Når naboerne fortæller mig, hvad jeg skal købe, og jeg så ville ønske, jeg havde fulgt deres råd, er det et sikkert tegn på, at markedet har nået toppen og er på vej til et styrtdyk.
Howard Marks siger, at flokken tager fejl, når det kommer til risiko, mindst lige så ofte som når det kommer til afkast. Når alle tror, at noget ikke indebærer nogen risiko, byder de prisen op til det punkt, hvor det er enormt risikabelt, og når alle mener, at noget er risikabelt, reducerer deres manglende vilje til at købe normalt prisen til det punkt, hvor det slet ikke er risikabelt. Den investering, som “alle” per definition anser for at være en god idé, kan ikke være det. Det, kombineret med variabel forstærkning, forklarer, hvorfor tendenser dannes, ændrer sig og inflekterer.
Markedstrends
Generelt investerer alle baseret på, hvad de fremtidige fundamentale udsigter vil være, uanset om det er et par måneder eller et par år ude i fremtiden. Det ville være mere rationelt at anlægge et årti-langt perspektiv, da det er der, størstedelen af nutidsværdien ligger. Folk har dog en tendens til at have et kortsigtet perspektiv, fordi det er for vanskeligt at estimere fundamentale forhold så langt ud i fremtiden med sikkerhed, især da præstationsvurderinger, i hvert fald for professionelle investorer, i høj grad afhænger af kortsigtede prisudsving.
Priserne bevæger sig i trends, fordi selve de grundlæggende faktorer, der ligger til grund for priserne, bevæger sig i trends, hvad enten det er indtjening, renter, beskæftigelse eller den overordnede konjunkturcyklus. Disse tendenser i de grundlæggende faktorer, såvel som prisudsving, betinger investorer til bestemte tankegange, der påvirker deres adfærd. Og når de ændrer sig, fralæres den tidligere tankegang og erstattes af nye.
Afhængigt af om man tilslutter sig hypotesen om et efficient marked eller ej, skulle man tro, at sådanne trendinflektioner direkte oversættes til prisudvikling. Men det er ikke det, der sker. Når en fundamental trendinflektion finder sted, er de investorer, der er ansvarlige for den gensidige prisudvikling, endnu ikke blevet betinget til at gøre det. Med andre ord skal investorer se prisen stige, selvom deres tankegang måske allerede har ændret sig, før de tror, at det vil ske. Uden den rette mængde forstærkning til at påvirke deres adfærd er tilliden til at handle på inflektioner i tankegangen en langsom proces snarere end en øjeblikkelig.
Hvis inflektionen er en vending fra bunden, som i marts 2009 eller marts 2020, går denne gradvise proces gennem Skinners koncepter om først straf, udryddelse og derefter forstærkning. For eksempel begyndte den amerikanske økonomi i første halvdel af 2008, da boligmarkedet var i en boble, at opleve et stramt arbejdsmarked, en restriktiv pengepolitik og enorm risiko i det finansielle system, mens investorernes tillid forblev høj. Den globale finanskrise ramte, og det tog indtil første halvdel af 2012, før markedet handlede på det tidligere niveau i 2008. Det var også et tidspunkt, hvor markedet steg sammen med stigende indtjening hos virksomhederne, en ekspansiv pengepolitik, voksende detailsalg og industriproduktion. Spørgsmålet er, hvorfor aktiemarkedet handlede til samme pris i 2008 og 2012, når de økonomiske udsigter var så forskellige. Svaret er naturligvis, at investorerne ikke var blevet betinget til at tænke på markeder i krisetilstand i 2008 og stadig havde tillid til markedet, hvorimod manglen på forstærkninger holdt tingene tilbage i 2012.
Det var indtil, det ikke gjorde. Dette fører os til, hvordan Federal Reserves øgede magt over markederne igen kan forklares med Skinners operante betingning. Fed-interventioner, der startede i 1998, da renten begyndte at falde, sneg sig langsomt ind på markedet i en sådan grad, at det gav investorerne tillid til at jagte renter og købe ethvert fald og enhver aktie til enhver pris. Og da det virkede i marts 2020, da markedet vendte tilbage til nye højder på meget kort tid, mens pengemaskinen skruede op i hidtil uset gear, kan markedet meget vel blive styrket igen, så når de fundamentale forhold virkelig er i nedtur, kan prisudviklingen, der berettiger et sådant fald, blive forsinket. Det vil sige, indtil tilliden igen er aflært, hvilket den vil, og cyklussen starter forfra.
Praktisk anvendelse for investorer
Operant betingning giver dig måske ikke en krystalkugle, der lader dig forudsige markedets fremtid. Du kan forstå den menneskelige natur og stadig tage fuldstændig fejl. Men det kan hjælpe dig med at forstå og reagere hurtigt på de ændringer, der sker i løbet af cyklusser, når investorernes risikoaversitet svinger mellem for meget og for lidt.
Hvis du starter med dig selv og opfatter din adfærd gennem den mentale model for operant betingning, kan du beskytte dig mod din hybris og finde styrken til at positionere dig selv korrekt, når du er på vej i forkerte retning.
Det kan også hjælpe dig med at handle, når den rette mulighed opstår. Ved at fjerne dit fokus fra prisen, enten når du køber eller sælger aktier, modstår du trangen til at vente på markedets fortsatte positive forstærkning for at give dig selvtilliden til at handle, selv når det betyder at købe en billig aktie på vej ned eller sælge en dyr aktie på vej op, eller endda sælge en aktie på vej ned eller købe en aktie på vej op, når det er det rigtige at gøre. Overvej det faktum, at efter at have slået de tidligere markedsrekorder i første halvdel af 2012, var markedet oppe med 100% fra bunden og ikke langt fra sine tidligere “boble”-højder. Og som altid var der bekymringer at tænke over: rekordstore driftsmarginer, en gældskrise i eurozonen og så videre. For den prisfølsomme investor ville der sandsynligvis være spørgsmål som 1) hvilken upside der er tilbage, og 2) om det være endnu en truende boble.
Der ville være masser af grunde til at holde sig ude af markedet, men det, der ville ske, er, at du ubevidst er blevet betinget til en så risikoavers tankegang, at du ville ønske at finde en grund til at priserne skulle falde, så du kunne købe ind. Men at være betinget til en tankegang er ikke det samme som at opnå visdom eller forståelse. For når du samtidig ville se masser af dårlige horisonter, ville du også se et forbedret boligmarked, stigende beskæftigelse og en lempelig pengepolitik. For hvert stigende niveau ville dit pessimistiske syn på markedet gradvist aftage. Og når S&P 500 ville bryde 1500, ville du langsomt blive akklimatiseret til ideen om højere priser, mens din tidligere betingning gradvist ville uddø sammen med resten af markedet, indtil det ville være et spørgsmål om at jagte markedet. Dit optimistiske syn ville i sidste ende være blevet betinget gennem kontinuerlig forstærkning af hver mislykket forudsigelse.
I virkeligheden er det ikke nemt at fjerne fokus på pris. Det menneskelige bias, der hedder forankring, får dig til at tro, at når priserne falder fra, hvor de har været, ser de billigere ud. Du forestiller dig muligheden for, at de kan vende tilbage til, hvor de var for nylig, netop fordi du er blevet forstærket, i skinneriansk stil, fra den fremherskende trend. Og hvis den vision opfyldes én gang, vil den forstærke dig til igen at blive offer for din medfødte bias næste gang. Derfor er det så vigtigt at fjerne fokus på pris, såvel som urealiserede gevinster eller tab.
Endelig er en anden vigtig observation fra Skinner, at operant betingning påvirker vores tænkning og endda vores sprog gennem hele livet, ofte på subtile måder. Vi reagerer på det, vi ønsker at høre, fordi vi er blevet betinget gennem vores følelsesmæssige reaktioner. Desværre er de følelsesmæssige faktorer, der former vores tænkning, ikke altid orienteret mod sandhed, men snarere mod andre værdier, såsom at opbygge relationer, opnå status eller erhverve ressourcer. Denne mangel på sandhedsorientering er generelt ikke et problem, undtagen i forbindelse med investering, hvor konsekvenserne af at tage fejl kan være ødelæggende. For at undgå dette problem skal du have konstant fokus på sandheden i investeringsbeslutninger og sikre, at dine tanker og udsagn afspejler en ærlig beskrivelse af virkeligheden snarere end at blive påvirket af skjulte omstændigheder såsom ønsket om status, anerkendelse eller at bevare en ideologi.