자발적인 행동은 명시적인 보상 없이 강화에 의해 구조화됩니다.
홈페이지홈페이지 > 소식 > 자발적인 행동은 명시적인 보상 없이 강화에 의해 구조화됩니다.

자발적인 행동은 명시적인 보상 없이 강화에 의해 구조화됩니다.

Feb 12, 2024

Nature 614권, 108~117페이지(2023)이 기사 인용

48,000회 액세스

10 인용

296 알트메트릭

측정항목 세부정보

자발적인 동물 행동은 뇌에 의해 시퀀스로 연결되는 동작 모듈을 통해 구축됩니다1,2. 그러나 자연주의적이고 자기 동기가 부여된 행동의 구성을 안내하는 신경 메커니즘은 아직 알려지지 않았습니다. 여기서 우리는 작업 구조, 감각 단서 또는 외인성 보상이 없음에도 불구하고 생쥐가 자발적으로 1초 미만의 행동 모듈을 표현함에 따라 도파민이 배측 선조체(DLS)에서 체계적으로 변동한다는 것을 보여줍니다. 개방형 행동 중 광도 측정 기록 및 보정된 폐쇄 루프 광유전학적 조작은 DLS 도파민 변동이 몇 초 동안 서열 변화를 증가시키고, 몇 분 동안 관련 행동 모듈의 사용을 강화하며, 운동 시작에 직접적인 영향을 주지 않고 모듈이 표현되는 활력을 조절한다는 것을 보여줍니다. 순간의 운동학. 광유전학적 DLS 도파민 조작의 강화 효과는 행동 모듈과 개별 마우스에 따라 다르지만 이러한 차이는 내인성 도파민과 모듈 사용 간의 관계에서 관찰된 변화에 의해 잘 예측됩니다. DLS 도파민 변동이 교육 신호로 작용할 가능성과 일치하여 마우스는 마치 도파민을 최대화하는 것처럼 탐색 중에 시퀀스를 구축합니다. 함께, 이러한 발견은 구조화된 작업에서 행동 선택을 지배하는 동일한 회로와 계산이 제한되지 않은 고차원적이고 자발적인 행동의 내용을 조각하는 데 중요한 역할을 하는 모델을 제안합니다.

자발적인 행동은 구조를 나타냅니다. 동물행동학자들은 야생에서 동물의 자발적인 행동은 시간이 지남에 따라 예측 가능하면서도 확률적인 방식으로 서로 연결된 모듈식 구성 요소를 통해 유연하게 구축된다고 오랫동안 주장해 왔습니다1. 주화성, 손질, 먹이 찾기, 구애, 새 노래 및 탐색 이동을 포함하여 잘 연구된 많은 실험실 행동은 모듈성과 예측 가능성을 특징으로 합니다2,3,4,5. 그러나 뇌가 특정 순간에 개별 행동 모듈의 표현을 어떻게 조절하는지, 또는 실험적 제한, 작업 구조 또는 외인성 없이 동물이 자신의 의지로 행동할 때 관찰되는 유동적 행동으로 이러한 모듈을 동적으로 구성하는 방법은 불분명합니다. 보상.

흑색질(SNc)로부터의 도파민성 뉴런의 손실이 작용 개시 및 시퀀싱에서 확산적 결함을 야기한다는 점을 고려하면, 신경조절제인 도파민이 자발적인 행동의 구조에 영향을 미칠 가능성이 높습니다6,7,8. 그러나 우리는 동물이 환경을 자유롭게 탐색할 때 도파민과 행동 사이의 정확한 관계에 대해 거의 알지 못합니다. 도파민은 자발적인 행동에 동기를 부여하고 행동이 표현되는 활력에 영향을 미치는 것으로 생각되지만, 위상 도파민 과도가 움직임을 허용하거나 인과하는지, 동물이 움직임을 시작할 때 도파민이 상승하거나 하락하는지, 도파민 변동 여부에 대한 증거는 혼합되어 있습니다. 자유롭게 행동하는 동물6,9,10,11,12,13,14,15,16,17,18,19의 운동 운동학을 지정합니다. 대조적으로, 동물이 명시적이고 종종 단서가 있는 보상을 추구하는 구조화된 작업 동안 위상 도파민은 보상 및 보상 예측 오류와 관련된 정보를 명확하게 전달하고 보상 관련 행동을 강화하며 대체 행동 간의 선택에 영향을 미칩니다20,21,22,23 ,24,25.

도파민은 다양한 방식으로 서로 다르기 때문에 자발적이고 작업 구조화된 행동 중에 뚜렷한 역할을 할 수 있습니다. 예를 들어, 자발적인 행동은 일반적으로 더 다양한 표현된 행동 모듈을 나타내고, 더 복잡한 행동 시퀀스를 포함하며, 활성 감지와 관련된 자체 시작 움직임을 강조하는 경향이 있습니다. 그럼에도 불구하고, 자발적인 행동과 구조화된 작업 모두 동물이 가능성의 분포에서 지속적으로 행동을 선택하도록 요구합니다. 보상.

 0.05 for controls, two-sided Mann–Whitney U test comparing stimulation with catch trials). Syll, syllable. j, Sequence context changes from baseline to post-stimulation for an example mouse–target pair. Sequences proceed from left (incoming syllables) to right (outgoing syllables). Nodes are sorted by decreasing frequency at baseline. k, Average change in inbound and outbound transitions for target syllables on stimulation day sorted by the baseline rank of the transition. Traces are smoothed with a five-point rolling average. Shading indicates bootstrap s.e.m. l, Average kinematic parameters aligned to stimulation in Opto-DA mice and controls. Shading as in i. No comparisons between stimulation and catch trials in any of the mice were significant (P > 0.05, one-sided Mann–Whitney U test). m, As in l, but following 3-s-long stimulation. The solid bar indicates significance (P < 0.05, one-sided Mann–Whitney U test)./p>