بیوفیدبک ریلکسیشن

بیوفیدبک ریلکسیشن

بیو فیدبک تکنیک بدست آوردن توانایی خود تنظیمی یک تابع بیو لوژیکی است. که معمولا بطور طبیعی نا خود آگاهانه است.که بصورت(1) یک مسیر اطلاعاتی خارجی با فیدبک کردن شرایط فیزیولوژیکی داخلی به یک حس دیداری یا شنیداری  (2) یادگیری ذهنی در سطح هشیاری  با اطلاعاتی که از حواس در یافت می شود.(3) بدست آوردن احتمال توانایی برای کنترل اختیاری شرایط داخلی بدون مساعدت مسیر خارجی مشخص می شود.اگر چه بیو فیدبک بطور گسترده در بیماریهای روان تنی مورد استفاده است و اثرات مثبت آن تایید شده است .ولی پایه های عصبی آن هنوز نا شناخته است.

در این قسمت مسئله بیو فیدبک با بررسی عوامل دخیل در آن و از دیدگاه کنترلی در شرایط مختلف و متنوع با الهام از سیستمهای عصبی عضلانی مورد بررسی قرار می گیرد.

از نظر تقسیم بندی بیو فیدبک را می توان به دو دسته تقسیم نمود:

1-بیو فیدبک ارادی

2- بیو فیدبک غیر ارادی

بیو فید بک غیر ارادی به آن قسم از بیو فیدبکهایی گفته می شود که مسیر فیدبک آن یا داخلی بوده و از طریق سنسوریهای داخل بدن یا حس بینایی ، شنوایی و… تامین می شود اما فرد بطور آگاهانه سعی در تصحیح فرایند بیو لوژیکی ندارد.که بعنوان مثال می توان انواع حرکتهای رفلکسی را  نام برد.

اما بیو فیدبک ارادی به آندسته از بیو فید بکی گفته می شود که تحت تاثیر خواست  اراده و تصمیم شخص شروع و کنترل می شود و مسیر فید بک خارجی در آن وجود دارد که از طریق حواس پنج گانه مسیر آن بسته می شود.

در اینجا بحث ما بر روی بیو فید بک ارادی است که آن را می توان تعاملی بین آنچه که مغز برای کنترل برنامه ریزی کرده و آنچه که از طریق پسخورهای محیطی به آن وارد می شود در نظر گرفت.البته هر عملی پس از رسیدن فرد به مهارت ، تبدیل به یک سیستم کنترل حلقه باز می شود.پس در ابتدا سیستم بصورت یک سیستم حلقه بسته بوده و سپس به صورت حلقه باز در می آید.در نوع حلقه بسته ما یک ورودی مرجع و یک فیدبک کنترلی جهت تثبیت وضعیت  مطلوب داریم و از نظر کنترلی یک سرو سیستم کامل می باشد.که هم ورودی آن و هم بر خی از پارامتر های داخلی اش  توسط سیستم مر کزی اعصاب کنترل میشود.در این الگو میزان یکی از پارامتر ها مانند  EEG ،GSR ،ضربان نبض و … توسط فیدبکهای حسی به گونه ایی مناسب به فرد اطلاع داده می شود و فرد با توجه به آموزشهایی که در ضمینه تنظیم بدنی خود (خواه توسط خود فرد کسب شده باشد خواه  به وی آموزش داده شده باشد.) دارد ، با توجه به این ورودی سیستم مورد نظر را کنترل می کند.مثلما در این مسئله عوامل روحی و روانی و اغتشاشات محیط خارج بی تاثیر نیستند.در اینجا می توان از مدلهای ارائه شده در حرکتهای تعقیب کنایی با مرجع ذهنی که در آن  فرد با توجه به فیدبک داده شده و آموزشی که از قبل دیده است هدفی را در ذهن خود تجسم کرده  و سپس سعی در دنبال کردن آن می نماید استفاده نمود.[1]

اما در حالتی که فرد به مهارت دست پیدا می کند نیازی به فیدبک  جهت اصلاح وضعیت خود ندارد.این مهارت بعلت بهره گیری صحیح از حافظه پیش برنامه ریزیهای دقیق و مناسب مغزی برای کنترل سیستم معیوب و نیز تنظیم مناسب سیستمهای فیدبک داخلی می باشد.

اما به عنوان غایت نهایی این فرایند می توان حالتی  را در نظر گرفت که نقطه کار سیستم آسیب دیده  به حالت عادی باز گشته یا تراژکتوری در بستر جذب مناسب در حرکت می باشد.

اما اصلی که در اینجا ما به آن معتقدیم اینست که ما در بیو فیدبک همیشه نمی توانیم تابع اصلی کنترلی  را که فرایند مورد نظر راکنترل می کند بطور مستقیم تحت  کنترل در بیاوریم بلکه کاری که در بیو فیدبک انجام می شود تغییر وزنهای شبکه عصبی مغز است که در نهایت موجب می شود که عملکرد کلی بهبود پیدا کند.یعنی هرچند که ما بخش دیگری از مغز را به صورت عمده برای در مان تحت کنترل در می آوریم   لیکن با توجه به ارتباطی که این بخش با بخشهای دیگر و مخصوصا بخش کنترل کننده تابع بیولوژیکی مورد نظرما بخشی که نقطه کار آن تغییر کرده است)دارد و همچنین تعاملاتی که این دو بخش دارند، در نهایت ما یک بهبود رفتار در این قسمت را خواهیم داشت.بعبارت دیگر تغییر در یک وزن شبکه عصبی در نهایت موجب تغییر در وزن قسمتهای دیگر  می شود که تابع بیولوژیکی مورد نظر ما نیز جزء آنهاست و ما را به هدف مورد نظر می رساند.

در حقیقت ما با تغییر در یک بخش موجب تغییر state  مغز و به تبع آن تغییر در رفتار قسمتهای مختلف می شویم .در اینجا ما با استفاده از داده های آزمایشات fMRI نشان می دهیم که  در بیو فیدبک  فقط تغییر در یک تابع بیولوژیکی  اصلی برای تغییر یک فرایند لازم نیست بلکه با ایجاد تغییر در بخشهای دیگر مغز که مرتبط با آن تابع هستند نیز می توان این کار را انجام داد. پس از آن با استفاده از الگوها و مدلهایی که برای سیستمهای عصبی عضلانی موجود است به مدلسازی بیو فیدبک می پردازیم.

در این جا برای مدلسازی  بیو فیدبک به مدلهای شبکه های عصبی عضلانی استناد می کنیم  و به دو دلیل این کار دارای ایراد نمی باشد:

  • با توجه به اینکه گونه ایی از بیو فیدبک که برای توان بخشی مورد استفاده قرار می گیرد عملا بحث سیستمهای عصبی عضلانی و در آنها مطرح میشود و فیدبک حرکات را در آنها داریم لذا می توان از مدلهای مربوط به سیستمهای عصبی عضلانی در این بخش برای مدلسازی بیوفیدبک استفاذه کرده وآنها را بصورت یک مدل کلی به بیو فیدبک تعمیم دهیم. البته  شاید این نوع مدلسازی ، در برخی از انواع مدلهای بیو فیدبک جوابگو باشد ولی با توجه به اینکه به نوعی بخشی از جنبه های بیو فید بک را مدل کرده است می توان با برخی تعمیم ها  پاسخگوی انواع دیگر نیز باشد.

 

  • هرچند که مدلهای سیستمهای عصبی عضلانی در مورد کنترل حرکات هستند ولی اکثر کارهایی که انسان انجام می دهد از یک الگوریتم خواص پیروی می کند و همچنین با توجه به اینکه این مدلها بصورت کلی عنوان شده اند لذا تا حدی می توانند در این مورد خاص نیز بکار روند که ما در جای خود به دلیل استفاده از مدلهای آورده شده ، اشاره می کنیم.

3-در بیو فیدبک ما یادگیری را برای سوژه ها متصور هستیم که در این حالت از مدلهای مربوط به فرایند یادگیری که بین بسیاری از فرایندهای ذهنی مشترک است می توان استفاده نمود.که می توان تشابهاتی را با دیگر فرایندها برای آن قائل بود.

 

 

 

 

 

 

 

 

بخش اول

 

  • (ثبت داده)[2]و[4]

فعاليت الكتريكي پوست ناشی از تحريكات سمپاتيك غدد عرقي eccrine پوست است که موجب تغيير كندوكتانس جريان اعمال شده مي‌شود. EDA هم حوادث زودگذر سريع (كه پاسخ كندوكتانس پوست ناميده مي‌شود) وهم جابجايي تدريجي در سطح اصلی (سطح كندوكتانس پوست) را منعكس مي‌كند. فعاليت‌هاي سمپاتيكي به حالت‌هاي شناختي و احساساتي مرتبط است و EDA به طور گسترده‌اي براي شاخص حساسيت برانگيختگي جسمي مربوط با احساسات توجه مورد استفاده است (وناپل و كريستي 1980) هم‌چنين شواهدي وجود دارد كه اثبات مي‌كند برانگيختگي سمپاتيك كه خود را در EDA نشان مي‌دهد مي‌تواند براي تأثير در حالت‌هاي هيجاني و فرآيندهاي شناختي از قبيل تصميم‌گيري و حافظه بازخورد شود.(دامايسو 1991)

نقش فعاليت خودكار وابسته به هيجان و پيامدهاي پاتوفيزيولوژيكال اختلالات استرس و اضطراب از موضوعات مهم كلينيكي است.

سطوح بالاي تحريكات سمپاتيكي نشانه اختلالات اضطرابي و استرسي هستند. و در پی آن مداخلاتی كه تحريك خودكار سطح پاييني را در كاهش استرس و اضطراب و افزايش حال خوب ايجاد مي‌كند. در ميان اين تكنيك‌ها، بيوفيدبك ريلكسيشن به سوژه‌ها اجازه تأثير بر فعاليت خودكار را به طور اختياري با تهيه فيدبك realtime مثلا توسط EDA مي‌دهد بيوفيدبك ريلكسيشن در مورد سوژه‌هايي كه كاهش تحريكات سمپاتيك را فرا مي‌گيرند ممكن است يك اندازه‌گيري كمي تون سمپاتيك را فراهم كند.

مطالعات آزمايش تون سمپاتيك با استفاده EDA ،روي دامنه پاسخ استخراج شده به وسيله تحريك محرک متمركز شده است. پيكهاي بيرون كشيده شده در EDA به طور گسترده به تغييرات درونی فرد، تداخلات محيطي از قبيل دماي محيط، تفاوت در روش‌هاي ثبت و اثرات زماني خوگيري پاسخ با تحريكات اعمال شده حساس هستند. عمل بيوفيدبك ريلكسيشن مستلزم غلبه EDA بر  تعداد زيادي از اين مسائل با فراهم كردن يك اندازه‌گيري كمي Objectiv است كه به طور گسترده‌اي مستقل از تفاوت در دامنه پاسخ‌هاي evokad بيرون كشيده شده است.

آزمايشات تصويري فانكشتال بر نواحي خاصی از مغز در توليد و ارائه بازخورد تحريك خودكار دلالت دارد. اين نواحي شامل برخي نواحي مرتبط با تحريك و توجه از قبيل كمربند فوقاني، اينسولا، اوربيتو فرانتال كرتكس و لب جداري تحتاني است. هم‌چنين مطالعاتي براي تخمين رابطه فعاليت مغزي به مدتيشين و هيپتوتيزم انجام شده است(Lazar 2000). كه در آن‌ها فعاليت همراه با اين فرآيندها نمايانگر نقش محوري كمربندقدامی كرتكس است.

مطالعه كنوني تأثير اراده شناختي در سمپاتيك ريلكسيشن را تخمين مي‌زند. (مثلا كاهش انگيختگي سمپاتيك محيطي) سوژه‌هاي سالم را در اجراي تمرينات بيوفيدبك ريلكسيشن آموزش داديم و از PET براي تخمين همبستگي كالبدشناسي اعصاب ،کاهش در EDA ،ارتباط فعاليت شناختي به اراده براي آرامش داشتن و اثر بیوفیدبك بر روي این فرآيند آرامش استفاده شده است ،و هدف از اين مطالعه شناخت مكانيسم‌هاي مغزي از طريق آن دسته پردازش كردن تغييرات در پاسخ‌هاي آناتوميكي بدني است.

.1-2سوژه‌‌ها

هشت داوطلب مرد راست دست ( با متوسط سن 41) بعداز گزينش پزشكي و رد اختلالات گزينشي با تجويز دارو كه ممكن است بر روي فعاليت مغزي تأثير بگذارد استخدام شدند. از سوژه‌هاي زن جهت مطالعه استفاده نشده به خاطر محدوديت‌هاي مرتبط با (Adminstration of Radioactive Sabstance Adwisory Committee Licence).

قبل از مرور اجمالي سوژه‌ها با تمرين بيوفيدبك ريلكسيشن آشنا شده و قادر به انجام وظيفه به صورت حرفه‌اي و قابل اعتماد را داشتند.

.1-3طرح آزمايشي

سوژه‌ها سه بار تكرار چهار عمل در يك طرح آزمايشي  فاكتوريل را انجام دادند. اين طرح فاكتوريل تخمين فعاليت نواحي مرتبط با اثر اصلي ريلكسيشن، اثر ناشي از دريافت فيدبك EDA و تقابل بين اين عوامل را ممكن ساخت، كه اجازه شناسايي نواحي كه فعاليت وابسته به ريلكسيشن به وسيله Biofeedbook را مي‌دهد. براي هر سوژه وظيفه‌ها در يك دستورالعمل تصادفي ارائه شده بود. EDA (فعاليت الكتريكي پوست) به طور پيوسته و در تمام طول آزمايش نمايش داده شده بود.

سيگنال‌هاي بيوفيدبك ريلكسيشن خطي قرمز روي زمينه خاكستري روشن با cm12 ارتفاع و cm1 پهنا بود. آشكار شدن حرارت پنج بر روي صفحه نمايش علامتي به سوژه‌ها براي شروع تمرين ويژه يا وظيفه مربوط بود.

با آرام شدن سوژه‌ها ارتفاع حرارت‌سنج كم مي‌شود. تغيير در ارتفاع ستون حرارت‌سنج يك تابع لگاريتمي تغييرات در EDA سوژه‌ها را ارائه مي‌كند هم‌چنين ارتفاع ستون مي‌تواند بصورت تغيير تصادفي مرتب شود.

.1-4آموزش دادن در تمرين بيوفيدبك ريلكسيشن

به سوژه‌ها انجام بيوفيدبك ريلكسيشن به صورت ماهرانه در طول روز قبل از مطالعه آموزش داده شده بود. سوژه‌ها در مورد تكتيك‌هاي بيوفيدبك و آماده شده با اثبات بيوفيدبك ريلكسيشن آگاه بودند. براي يك دوره 5 دقيقه‌اي سوژه‌ها نمايش ارتباط نوسان سطح تون‌سمپاتيك خود را مشاهده كردند. سپس آن‌ها  به كوشش جهت ریلکس کردن خود تشويق شدند و در این  حالت مانیتورینگ فیدبک انجام می شد و در طول زمان 30 تا 45 دقيقه آن‌ها مدوله كردن تون‌‌سمپاتيك خود را با استفاده از بيوفيدبك ياد گرفتند. فقط قبل از اسكن سوژه‌ها تست شدند تا مطمئن شويم كه آن‌ها قابليت باقي ماندن در تمرينات بيوفيدبك ريلكسيشن را دارند. در زمان اسكن، انجام كار بيوفيدبك ريلكسيشن به وسيله فيزيوتراپي آرام بين اسكن‌ها و تشويق‌ها و نورهاي مناسب براي انجام سريع و صحيح وظايف تسهيل شده بود.

.1-5عمليات آزمايشي

بيوفيدبك همراه با ريلكسيشن ارادي

سوژه‌ها از طريق ريلكسيشن سعي مي‌كردند تا ستون حرارت‌سنج را به كاسه بازگردانند. معمولا سوژه‌ها اين كار را در طي 2 تا 3 دقيقه انجام مي‌دادند.

1-5-1. بيوفيدبك بدون ريلكسيشن

سوژه‌ها نيازمند تماشاي تصوير بدون ريلكسيشن بودند اما بايد سعي در جلوگيري از هرگونه انحراف به سمت پايين حرارت‌سنج به وسيله هيچ‌گونه استراتژي كه مستلزم حركت بدن يا اعضا باشد مي‌كردند.

.1-5-2 بيوفيدبك تصادفي به همراه ريلكسيشن

سوژه‌ها همان نمايش ويديويي حرارت‌سنجي كه تصادفي نوسان كرده است در محدوده بالاي ارتفاع ستون ديدند. در حال تماشا كردن صفحه نمايش لازم داشتند كه آرام شوند. اگر چه آن‌چه بر روي صفحه نمايش ظاهر شده بود ربطي به پاسخ‌هاي فيزيولوژيكي سوژه‌ها نداشت.

.1-5-3. بيوفيدبك تصادفي بدون تمرين ريلكسيشن

همانند عمل قبل سوژه‌هامشغول به تماشاي يك صفحه نمايش ويديويي نوسان‌دار، كه سطح برانگيختگي آن‌ها را نشان نمي‌داد بودند. در طول اين عمل آزمايشي به سوژه‌ها گفته شده بود كه سعي در آرام كردن خود نداشته باشند. (به عنوان بيوفيدبك بدون ريلكسيشن)

.1-6نمايش EDA و بيوفيدبك

EDA منعكس كننده سطح هدايت پوست به طور پيوسته با الكترودهاي نقره‌اي بسته شده به سطح كف دست چپ و انگشتان وسطي و سيگنال از طريق يك واحد پرداز نگرش كردن‌‌هاي تغذيه شده بود.

(SCL 200 ;Biofeedback Systems, Manchester, uk) خروجي آنالوگ فيلتر شده EDA به صورت Online نمايش داده شده و به صورت ديجيتالي روي يك PC و در MATLAB ذخيره مي‌شود.

(Math Warks Sherborn Mass, USA)- در MATLAB يك فيدبك براي هدف فراهم كردن صفحه نمايش ديداري به سوژه در زمان بيوفيدبك ايجاد شده بود. داده‌هاي EDA ناخالص (هر ms 100) به وسيله لگاريتم طبيعي و تغييرات زماني 9تبديل شده بود. در شروع عمليات بيوفيدبك سطح اين تابع به 1 نرماليزه شده بود و صفحه نمايش حرارت‌سنج ارتفاع تابع نرماليزه شده را نشان مي‌داد. (شكل 1)

شکل (1)

 

در آزمايش‌هايي كه در آن‌ها هيچ بيوفيدبكي داده نشده بود. نمايگر حرارت سنج به وسيله توابع تصادفي حركت‌ مي‌كرد. (مقدار جديد=  + (5/0 مقدار قديمي) – مقدار قديمي).

.1-7تجزيه و آناليز اسكن PET

اسكن‌هاي  به وسيله اسكنر‌ Siemens XCPS ECAT EXACT HR+PET و در مد 3D با حساسيت بالا انجام شده است. سوژه‌هاي مجموع  از در  از طريق يك كانوله (ماسوره) براي هر 12 اسكن و فعاليت دريافت كردند در طول زمان  پنجره اندازه‌گيري شد در حاليكه سوژه‌ها عمليات آزمايش را انجام مي‌دادند. تصاوير PET از وکسلهای (1وکسل =یک حجم سه بعدي كه با يك پيكسل معادل است) ( ) با  طول محور 7/5 رزولوشن محور تشكيل شده است. به وسيله مسيردهي پارامترهاي استاتيکيSPM 99)) اجرا شده و در MATLAB آناليز شده بود. MRI هاي ساختاري از هر سوژه به داده PET پس از هر ساماندهي مجدد سري‌هاي زماني PET به داده PET ثبت شده بود. سپس تمام اسكن‌ها به يك فضاي استريوتاكتيك منتقل شده بود.(Friston 1995, Talairach & Tournoux 1988 ).

داده بعد از تبديل به ساختار ماتريسي براي تجزیه به گروه داده براي شرايط و متغیرها آناليز شده بود. CBF كلي به صورت ماتريس به عنوان ANCOVA (تجزيه كوواريانس) به وسيله سوژه‌ها داده شده بود و به عنوان يك كوواريانس متغير در آميختگي اعمال شده بود.

سرعت ريلكسيشن سمپاتيك براي هر اسكن ثبت شده بود. آناليزهاي ما ،از يك طراحي فاكتوريل در جستجوي اثر اصلي ريلكسيشن استفاده می كرد. بيوفيدبك تعامل ريلكسيشن×بيوفيدبك (جدول 1). اين روش اجازه شناسايي نواحي فعال مغزي مرتبط با ريلكسيشن (مستقل از فيدبك بصري)، فعاليت مربوط شده با بيوفيدبك EDA (مستقل از ريلكسيشن عمدي) و نواحي كه مربوط به بيوفیدبک و ريلكسيشن هم‌زمان بوده‌اند را مي‌دهد. به علاوه روش فاكتوريل توان آماري بيشتري از اثرات ساده را در گزارش به عنوان استفاده از تمامي مجموع داده‌ها داشت، آناليز سرعت ريلكسيشن اندازه‌گيري شده، مستلزم تعيين نواحي مغزي مرتبط با تغييرات در تون‌هاسمپاتيك مشترك به عمليات ريلكسيشن و بدون ريلكسيشن بود. سرانجام ارتباط بين سرعت‌هاي ریلکسیشن اندازه‌گيري شده و فعاليت نواحي مغزي در آناليزهاي قبلي مشخص شده است.

روش‌هاي عمومي به كار رفته به وسيله نقشه‌برداري پارامتري استاتيك به تفضيل به وسيله فريستون و دانشگاهها (فريستون و ديگران 1995) شرح داده شده است.

 

براساس مشاهداتي در مورد كنترل مغزي تابع آناتومي از جراحت، تحريك و مطالعات تصويري در انسان، ما پيش‌بيني مي‌كنيم كه فعاليت در نقاط مشخص از مغز وجود دارد كه با عمل تمرينات بيوفيدبك ريلكسيشن مرتبط است آسيب‌هاي كمربند قدامي نواحي، اوربيوفرانتال كرتكس، اينسولا، آميگدالا و لب جداری تحتاني به عنوان نواحي كه بر اندازه‌هاي EDA اثر گذارند و موجب برانگيختگي آن مي‌شوند شناسايي شده‌اند.( داماسیو و ديگران 1991،ترنل و داماسیو 1994 و به چارا و ديگران 1995) تحريك كمربند قدامي، اينسولا و آميگوالا لب تمپورال پزشكي پاسخ‌هاي احشايي و قلبي و عروقي را مدوله كرد. (پول و رانسهوف 1949    ،اپنهایمر ودیگران1992) مطالعات تصويربرداري عملكردي ارتباطي بين كمربند قدامي، مداري، (Ventromedial Prefrontal) اينسولا و كرتكس پس سري آهيانه‌اي، آمیگدالا، پل مغزي و قطعه مياني مخچه مغزي با ميزان تحريك در اندازه‌گيري‌هاي EDA با اندازه‌گيري‌هاي قلبي و عروقي را گزارش كرده است.

ما تجربه‌ها رابه صورت ابتدايي با P های كوچكتر از 001. كه به صورت تصحيح نشده هستند محدوده‌بندي كرديم. و متناوباٌ فعاليت‌ها را در طبقاتي كه بيشتر از 10 وكسل بود، كه پيك فعاليت به صورت قابل مشخصي براي تمام مغز در P هاي كوچكتر از 0.5 تصحيح شده بود گزارش كرديم. به علاوه برای اجتناب از خطاهاي نوع دوم براي مناطق پيش‌بيني شده مقیاسی در نظر گرفته شد و از تقریبهای كمتر استفاده شد. (Worsly 1966) فعاليت‌هاي مناطق مغزي سابقا مربوط به كنترل خودكار بود. براي مثال كمربند قدامي يا اوربيوفرانتال، اينسولاو و كرتكس آهيانه‌ايي تحتاني، آميگدالا و پل مغزي و قطعه مياني مخچه يا با همانندهاي مخالف نشان كه به مقدار قابل توجهي در P هاي كوچكتر از0.001 تصحيح نشده مي‌رسند پس از آن ما براي اعداد تصيح شده باا استفاده از حجم‌هاي فضايي كوچكتر از شعاع‌هاي mm10 كه با مركز مختصات به دست آمده از آزمايش‌هاي قديمي تصويربرداري عملكردي مستقل ،آزمايش كرديم.(Worsly 1966) بنابراين ما از مختصات x و y و z كه به صورت جلويي، جداري و عمودي در مقياس ميليمتر براي تصحيح مقادير كم استفاده كرديم.تصحیحها برای مقادیر کوچک:كمربند قدامي 38 , 20 , 16 ± (0 Kirchtly 200) ، كرتكس مياني پشتيباني 2 , 14,46 ±( Kritchly 2000)، كرتكس اوربیتوفرانتال و اينولاي پيشين -12 , 26 , 36± و اينسولا 14 , -6 ,   كرتكس تحتاني 4 و -36 و 42± آميگدالا -24 , 3 , 24± پل مغزي 42 , -30 ,16± و مخچه مياني 20- , -52 , 2 ±.از مختصات تالا رياچ  (تالارياچ وتورنو 1788) و اطلس دوورنوی (دوورنوی 1991 ) به عنوان يكي از منابع براي مشخص كردن مكان‌هاي آناتوميكي اعصاب استفاده شد.

 

 .1-8  عملكرد رفتاري و تشريح

در زمان تشریح سوژه‌ها استفاده از دو روش اصلي ايجاد ريلكسيشن سمپاتيك را توضيح دادند كاهش تنش‌هاي لیمبيك و حركت در هر مورد يكي از ملزومات حين اسكن مي‌باشد. ايجاد نفس‌هاي آرام‌تر و نرم‌تر تصوير سازي صحنه‌هاي خوشايند نيز همچنين توسط بعضي سوژه‌ها به كار گرفته شده بود.

زماني كه ريلكسيشن به صورت مؤثر به دست آمده بود گزارش‌هاي سوژه‌ها همراه با حالت خواب آلودگي و احساس خوشايندي بود.

عليرغم مقدماتی بودن دوره‌هاي آموزش مناسب، ميزان تنوع و تفاوت بين سوژه‌ها در زمان بيوفيدبك ريلكسيشن مورد توجه قرار گرفت. كه با درجه‌اي از هيجان اجرايي در زمان اسكن همراه بود. با اين حال در ميان گروه ريلكسيشن با بيوفيدبك یا بدون بيوفيدبك كاهش‌هايي را در EDA كه به صورت قابل توجهي در بين دو عمل توليد مي‌شود به ميزان ريلكسيشن سمپاتيك  براي  حذف كرد.

1-8-1. فعاليت‌هاي مغزي انجام عمليات (ريلكسيشن)

اثر اصلي ريلكسيشن بر روي مغز توسط مقايسه فعاليت‌هاي ريلكسيشن و غير ريلكسيشن (با و بدون بيوفيدبك) ارزيابي مي‌شود. افزايش فعاليت كه در مناطق خاصي از مغز مشاهده شده بود كه شامل: كمربند قدامي چپ (كه هر دو در  تصحيح شده قابل توجهند. همراه با ريلكسيشن خود خواسته فعاليت‌هاي تشديد یافته مربوط به ريلكسيشن نيز همچنين در لب جداري تحتاني چپ مشاهده شده بود. (براي  تصحيح شده براي مقادير كوچك) جدول 2 و تصوير 2. اثر اصلي بيوفيدبك (در مقايسه با نمايش تصادفي با تغييرات فيدبك حرارت سنج) هيچ منطقه‌ايي از مغز را كه مقدار قابل توجه تصحيح شده برسد نشان نداد.

1-8-2 مدولاسيون ريلكسيشن به عنوان تابع فيدبك

با آزمايش كردن تقابل بين انجام بيوفيدبك و ريلكسيشن ما به دنبال پيدا كردن مناطقي از مغز بوديم كه فعاليت‌هاي مربوط به ريلكسيشن توسط بيوفيدبك مدوله مي‌شود. مقايسه بين فعاليت‌هاي در حين ريلكسيشن و غير ريلكسيشن در حضور و غياب بيوفيدبك بيان كننده فعاليت چشمگيري در مخچه مياني و كمربند قدامي دوگانه، كرتكس  مياني پیشانی (براي  تصحيح شده براي رقم‌هاي كوچك) بود.(جدول2وشکل 3).

شکل(3)

.1-9  فعاليت مربوط به سرعت اندازه‌گيري شده ريلكسيشن

ما بعدا فعاليت مغزي مربوط به سرعت متغير EDA در طول هر اسكن آزمايش کرديم. اين سرعت‌ها به دو رگرسور ماتريسي طبق سرعت ريلكسيشن شكل‌دهي شد: (1) هنگامي كه سوژه سعي در كاهش تون‌سمپاتيك مي‌كند و (11) هنگامي كه سوژه فعالانه كوششي براي ريلكسيشن نمي‌كرد. طی هم وظايف ريلكسيشن و هم غير ريلكسيشن و در هنگام انجام ريلكسيشن تنها فعاليت مرتبطي در EDA در همسايگي آميگدالاي راست مشاهده گرديد. (x و y و z مختصات 18 , 10 , 8-و 18 , 0 ,28-  تصحيح شده براي حجم آميگدالا ) (جدول 3 و شكل 4)

 

 

.1-10 فعاليت مربوط به ريلكسيشن ارادي و موفق

در نهايت ما چگونگي فعاليت مرتبط با سرعت‌هاي اندازه‌گيري شده تغييرات در EDA را در نواحي كه بيانگر تغييرات عمده ريلكسيشن ارادي بودند آزمايش كرديم. همان‌طور كه در بالا بيان شده فعاليت در كمربند قدامي چپ و گلوبوس پالیدوس است كه مخصوصا بين عمل ريلكسيشن و غيرريلكسيشن به طور خاصي برجسته شده است.

ما فهميديم كه فعاليت در كمربند قدامي به صورت منفي با سرعت تغييرات EDA در طول عمليات ريلكسيشن مرتبط است. (پيرسون  و ) اما نه در زمان عمليات غير ريلكسيشن (r=0/27 و كم اهميت). بنابراين فعاليت در كمربند قدامي اراده براي آرامش را نشان مي‌دهد و اين فعاليت هنگامي كه تون‌سمپاتيك كاهش داده نشده بود به مقدار ماكزيمم خود مي‌رسد. فعاليت در گلوبوس پالاديوس در مقايسه با كمربند قدامي رابطه مهم‌تري با سرعت تغييرات EDA در طول هر دو ريلكسيشن دارد. (منفي or=0/67 (P<0/00) و در مورد عمليات غير ريلكسيشن (مثبت r=0/9 و P<0/00) بنابراين فعاليت در گلوبوس پالیدوس در هنگام اراده كردن براي آزمايش افزايش مي‌يابد.

و نيز هنگامي كه اين اراده در ريلكسيشن با غير ريلكسيشن محقق نمي‌شود.

 

.1-11بررسی نتایج  آزمایش

اگرچه ما دانش كمي درباره چگونگي شناخت فرآيندهاي مؤثر روي پاسخ‌هاي جسمي داريم با وجود اين حقيقت آن است كه اين‌گونه تقابل‌ها همگراي به يك تئوري قدرتمند احساس و عمل تصميم‌گيري است. (داماسیو و ديگران 1991- داماسيو 1996 بچارا و ديگران 1997) بررسي‌هاي قبل فعاليت‌هاي مغزي مرتبط با ارائه فيدبك حالات برانگيختگي‌هاي جسمي را توصيف كرده‌اند. (فرد ريكسون ديگران 1998- سوفر و ديگران 1998 ،کریتچلی و ديگران 2000) همچنين فعاليت‌هاي پديدار شده به وسيله تكنيك‌هاي ريلكسيشن- شناختي از قبيل مديتيشن و القاعات هیپنوتیسمی توصيف شده است. (رينويل و ديگران 1992 و لازار 2000) به هر حال اين تحقيق براي اولين‌بار به اين سؤال كه فعاليت مغزي مرتبط با سوژه‌هايي كه به طور ارادي قصد در آرام نمودن خود با بيوفيدبك با بدون بيوفيدبك دارند چگونه است مي‌پردازد. ما فعاليت مغزي مرتبط با آرامش ارادي را در كمربند قدامي و قسمت مياني مخچه كه به طور مشخصي با بيوفيدبك در ريلكسيشن ارادي نمايان مي‌شد و فعاليت لب‌تمپورال مياني راست در همسايگي آميگدالا كه مرتبط با سرعت ثبت شده ريلكسيشن سمپاتيك در هنگام انجام تمامي وظايف بودند را مشاهده كرديم. اين يافته‌ها، شركت نواحي جداگانه زیادی را در كنترل حالات جسمي  پيشنهاد مي‌كند[4].

 

 

شکل(4)

 

انجام كار ريلكسيشن بيشترين فعاليت را در نواحي كمربند قدامي چپ فراخواني مي‌كند. اين نواحي حاشيه‌اي كرتكس در فرآيند حسي و شناختي و بخشي از يك سيستم توجهي مياني كه لبهاي كرتكس آميانه‌اي و پری فرانتال را در دوسمت در برمي‌گيرند، اثبات شده‌اند. (نوبرو ديگران 1997 مسلم1999)

اگرچه ريلكسيشن داراي بخش كوچكي از تمركز توجهي به پاسخ‌هاي بدني است (مثلا تنفس) با اين حال غير مختل است كه مدولاسيون تفسير واحدی براي فعاليت كمربند فراهم كند. آسيب به كرتكس كمربند قدامي مي‌تواند توجه یکپارچه را محدود كند.  اما سازش خودكار، پاسخي شامل پاسخ‌هاي سمپاتيك پوست را به وجود می آورد. (ترنسل و داماسیو 1994). افزايش فعاليت كمربند قدامي مي‌تواند ناشي از تحريكات خودكار قبلي باشد (مثلا كارهايي كه فشار خون را افزايش مي‌دهند) .(کریتچلی و ديگران 2000)

تحقيقات تصويربرداري عصبي نه فقط رابطه اين بين كمربند قدامي و پاسخ‌هاي خودكار بلكه همچنين جوانب اين رابطه را نيز پيشنهاد مي‌كند، ما به طور برجسته فعاليت كمربند چپ را در رابطه با آرامش ارادي مشاهده كرديم، كه در تقابل با فعاليت كمربند راست مشاهده شده ،در طول حالات القايي تحريك سمپاتيك است. ما همچنين قادر به شرح فعاليت كمربند قدامي چپ در رابطه با ميزان اندازه‌گيري شده ريلكسيشن سمپاتيك انجام شده در طول اسكن بوديم. به طور يكسان هم براي اراده ريلكسيشن و هم مدولاسيون با فيدبك فعاليت كمربندي قدامي چپ به طور مشخصي بين حالتي كه كار ريلكسيشن انجام مي‌شود و زماني كه انجام نمي‌شود متفاوت بود، و هنگامي كه ريلكسيشن انجام شده بود كاهش مي‌يافت.

بنابراين شواهد ما پيشنهاد مي‌كند كه، كمربند قدامي چپ در مدولاسيون ارادي حالات بدني تحريكي همسان با يك نقش رفتاري اجرايي درگير است و خودش مدوله شده به وسيله فيدبك آوران از جوانب مربوط به تأثير روي پاسخ بدني اين اراده‌ها است. (کریتچلی 2001)

به علاوه كرتكس كمربند قدامي، افزايش فعاليت در گلوبوس پالاديوس و لب آهيانه‌اي تحتاني نيز در ارتباط با عمل ارادي آرامش هستند. اگرچه الزاما عمل رفتاري ريلكسيشن كاهش در فعاليت موتوری را در بردارد، با این وجود بودن تنها يك تفسير براي افزايش مشاهده شده در فعاليت پالیدال غير محتمل است. فعاليت گلوبوس پالاديوس در انجام ريلكسيشن و غير ريلكسيشن فرق مي‌كند، اما همچنين با نفوذ اراده به طور مستقل مدوله شده بود. بنابراين آناليزهاي همبستگي افزايش قابل توجهي در فعاليت پالاديال با كاهش در تون‌سمپاتيك ،هنگامي كه سوژه‌‌ها اراده‌اي در جهت آرام شدن نمي‌كردند و هنگامي كه سوژه‌ها قادر به ريلكس شدن در طول عمل ريلكسيشن نمي‌شدند، را نشان داده است.

اين تابع شناسايي خطا با شواهد فيزيولوژيكي عصبي دليل فعاليت نوار بلند در خطاهاي سيگناليك در خروجي‌هاي پيش‌بيني شده همسان است. اگرچه كمربند قدامي و كرتكس اوربيتوفرانتال  نيز در شناسايي عدم مطابقت بين اراده (يا اميد) با فيدبك آوران ممكن است كمك كنند.

شركت لب آهيانه‌ تحتاني چپ به شناخت اراده، هنگام انجام دادن ريلكسيشن سمپاتيك به عنوان فعاليت مضاعف در لب آهيانه‌اي تحتاني راست ،دلالت در جهت توجه به تحريك خارجي داشته است.  يافته‌هاي پيشين ما يك زير لايه عصبي مشترك براي تحريك و توجه انتخابي در لب آهيانه‌اي راست را پيشنهاد مي‌كند. (کریتچلی 2000) در اين جا، يافته‌هاي ارائه شده فعاليت آهيانه‌اي را با شناخت مدولاسيون مشتق از تون‌سمپاتيك ،كه با فعاليت مضاعف در لب آهيانه‌اي چپ و تحريك سمپاتيك با فعاليت در لب آهيانه‌اي تحتاني راست همراه است را، پيشنهاد مي‌كند. بنابراين يك تعبير از اين يافته‌ها اين است كه فعاليت در لب آهيانه‌اي تحتاني چپ مربوط به توجه به حالات داخلي و نه تحريك خارجي است.

هم‌چنين فعاليت‌هاي مرتبط با بيوفيدبك ريلكسيشن به نواحي مغزي هم جهتي بيشتري را مخصوصا در نواحي كمربند قدامي كرتكس و مخچه مياني مي‌دهد. اين نواحي قبلا دلالت بر تحريكات قلبي عروقي داشتند. مستقل از چگونگي تحريكات ايجاد شده، مشاهداتي كه بر اين ناحيه در يكپارچگي پاسخ‌هاي بدني با اراده شناختي دلالت دارد،به طور شگفت‌آوري ما مشاهده كرديم كه، ناحيه بزرگتري در فعاليت كمربندي راست نسبت به چپ با بيوفيدبك ريلكسيشن مرتبط است. ما رابطه‌اي بين فعاليت لب آهيانه‌اي مياني راست، جلو و زير آميگدالا و ميزان ريلكسيشن خودكار پيدا كرديم. فعاليت در ناحيه آميگدالا شديدا با پاسخ‌هاي خودكار مرتبط است. (تحريك سمپاتيك كه معمولا حالات احساسي را از قبيل ترس و تهديد كردن را همراه دارند.) (ريس و ليدوك 1987 ،نورمارک 1997 و بوچل 1998) .تحقيق كنوني فعاليت لب آهيانه‌اي مياني در همسايگي آميگدالا را كه منعكس كننده ريلكسيشن تون‌سمپاتيك مستقل از اراده براي آرامش است را مشخص مي‌كند. روش‌هاي ما به ما اجازه اين كه آيا اين فعاليت نمايانگر كنترل وابران تون‌سمپاتيك است يا منعكس كننده نماد آوران ريلكسيشن بدنی است را نمي‌دهد. (شايد ارتباط آميگوالا با هسته ساقه مغز)

همانطور که نتایج  این آزمایش نشان می دهد نواحی که در EDA دخیل هستند و نواحی که در بیو فیدبک ریلکسیشن فعال می شوند تا حد زیادی با یکدیگر متفاوتند.نواحی مرتبط با EDA را سینگولت قدامی ، اوربیتو فرانتال کرتکس ، اینسولا ، آمیگدالا ، لب آهیانه ای تحتانی، پل مغزی و مخچه میانی(بر طبق نتایج آزمایشات) می دانیم .این نواحی در کنار هم پاسخ به تحریکات سمپاتیک را می سازند.اما نقاطی که با بیو فیدبک ریلکسیشن مرتبطند عبارتند از: سینگولت چپ و راست ،لب آهیانه ای تحتانی ، مخچه میانی ، گلوبوس پالیدوس و کرتکس  میانی پیشانی. همانطور که دیده می شود مرز اشتراک بین این دو بسیار ناچیز است .(یعنی مخچه میانی و لب آهیانه ایی تحتانی).و این مطلب را گواهی بر این مطلب می گیریم که در حقیقت این تغییر وزنها در مغز است که موجب بهبود در فرایند بیو فیدبک می شود.با استناد به این مطالب و اینکه مدلسازی های مغزی نقاط اشتراک فراوانی دارند ما با استفاده از مدلهای سیستمهای عصبی عضلانی به مدل سازی بیو فیدبک می پردازیم. همانطور که دیده میشود بر طبق نتایج این آزمایش سه جزء اصلی در یک سیستم عصبی عضلانی در این فرایند ها دخیل هستند(کرتکس،باسال کانگلیا و مخچه). در حقیقت این نقاط اشتراک بسیار هستند که ما را بسمت استفاده از این مدلها برای مدلسازی بیو فیدبک سوق می دهد. البته مسلما تمامی مدلها در اینجا قابل استفاده نیستند و در اینجا نیز  از مدلهای مشترک برای این منظور استفاده خواهد شد.

 

 

 

 

 

 

 

 

 

 

 

بخش دوم

 

.2-1 روش کار

بیو فیدبک تکنیک بدست آوردن توانایی خود تنظیمی یک تابع بیو لوژیکی است. که معمولا بطور طبیعی  ناخود آگاهانه از طریق یک سری کمکهای آموزشی که بو سیله مسیر فیدبک خارجی اضافه می شود است.ما یک مدل ریاضی برای بیو فید بک پیشنهاد می کنیم که در آن سیستم یاد گیری در سطح هوشیاری  مشخصات  یک سیستم تنظیم نیمه هشیارانه را مطابق با تابع بیو لوژیکی فرا می گیرد.هنگامیکه یاد گیری همگرا می شود سیستم یاد گیر خودش یک سیستم معکوس از سیستم تنظیم میشود.سپس اگر یک فرمان تنظیم به سیستم یادگیر در سطح هشیاری داده شود این فرمان سیستم تنظیم را بسمت پیروی اکید از فرمان بدون نیاز به مسیر فید بک خارجی پیش خواهد برد.که کنترل اختیاری تابع بیولوژیکی را ممکن می سازد.[3]البته همانطور پیش تر نیز ذکر شد هدف اصلی کنترل تابع بیولوژیکی بصورت صرف نمی باشد در حقیقت هدف ، تغییر State مغز بگونه ایی است که بتوان تابع بیو لوژیکی را بهبود بخشید زیرا ما تقریبا در اکثر موارد دسترسی مستقیم به این تابع نداریم و حتی می توان گفت که برای کنترل یک بخش از بدن نیز نمی توان یک قسمت خواص از مغز را نام برد.پس تعریف  ما از هدف ، تغییر وزنهای شبکه عصبی است به گونه ایی که بتوان بهبود عملکرد تابع بیولوژیکی را مشاهده کرد، خواهد بود.

بیوفیدبک را برای کاربرد های  مختلفی می توان انجام داد که یکی از آنها جهت توانبخشی است .در این نوع بیو فیدبک جدا از سیستم شناخت سیستمهای مرتبط با سیستمهای عصبی عضلانی نیز برای انجام یک عمل در گیر هستند لذا با توجه به این مطلب که در این مورد بخش مهمی از مدل بیو فیدبک مربوط و همانند سیستمهای عصبی عضلانی می شود  ، ما از این مدلها برای پیشبرد کار خود استفاده می نماییم.

ابتدا مدل کلی بیو فیدبک را که توسط آن یک سوژه عملی را فرا می گیرد(در بیوفیدبک ما با نوعی از یادگیری روبرو هستیم)ذکر می کنیم  که این مدل می تواند در مورد یادگیری بسیاری از اعمال عادی و روزمره هم کاربرد داشته باشد.سپس با توجه به نتایج بدست آمده از آزمایشات fMRI  که در بخش قبلی ذکر شده است و نقاطی را که در فرایند بیوفیدبک تاثیر گذارند برای ما مشخص می کند به مدل کردن این نقاط می پردازیم.

ما در اینجا 4 نقطه از مغز را که بیشتر با بحث بیو فیدبک متبط هستند مدل می کنیم .این 4 بخش عبارتند از :قشر مغز، باسال گانگلیا ،آمیگدالا  و مخچه.هرکدام از این 4 بخش به نحوی در فرایند بیو فیدبک موثر هستند و از این جهت این ها را برای مدلسازی انتخاب کرده ایم که در تصویر برداریهای fMRI این 4 بخش فعالیت عمده ایی از خود نشان داده و گمان بر اینست که این نقاط ارتباط بیشتری با فرایند بیوفیدبک دارند.سپس با توجه به مدل یادگیری تقویت شده (Reinforcment Learning) که مدل کلی ما را تشکیل می دهد جای هر کدام از این بخشها ذکر میشود.و ارتباط این نقاط با یکدیگر تبیین می شود.

2-2. مدل بیوفیدبک پیش از رسیدن به مهارت

2-2-1 . مدل کلی بیو فیدبک(Reinforcment Learning)

در بیوفیدبک هماند بسیاری از فرایند های دیگری که در مغز شکل می گیرد اولین مرحله یادگیری و شناخت است .که در این مرحله یک فرد با توجه به فیدبکهایی که به وی داده می شود و همینطور آموزشهایی که یاد داده می شود یا خود فرد بر اساس الگوی پاداش و تنبیه یاد می گیرد سعی در کنترل یک تابع بیولوژیکی یا همان خود تنظیمی می نماید .مدل این مرحله می تواند مشترک با مدلهای یادگیری در سیستمهای عصبی عضلانی باشد .

همانطور که می دانیم در یک سیستم عصبی عضلانی عوامل مهم و تاثیر گذار در فرایند کنترل عبارتند از :مخچه ، کرتکس و باسال گانگلیا و ارتباط این سه بخش از مغز که فرامین حرکتی را  می سازد[5].البته در بیو فیدبک مجموعه ایی از عوامل هستند که می توانند عامل بهبود باشند .با توجه به اینکه ما در بیو فیدبک به وزن دار شدن شبکه عصبی معتقد هستیم لذا حتما اینگونه توقع نداریم که  تابع کنترل اصلی را اصلاح کنیم هرچند که در پاره ایی موارد می تواند این اتفاق بیفتد. ولی آنچه که مهم است وزن دار شدن شبکه در جهت بهبود است.و در مرحله اول یادگیری در جهت وزن دار کردن این شبکه است.

در اینجا مدل یادگیری تقویت شده را بعنوان پایه ایی برای کار خود قرار دهیم.یعنی مدلی همانند شکل (5) . همانطور که در شکل دیده می شود عملگر وضعیت x را مشاهده می کند که در این وضعیت می تواند توسط دستگاههای مانیتورینگی که برای فیدبک کردن یک حالت خاص (مثل EEG یا ECG  و یا هر مشخصه دیگری که از سیگنالهای حیاتی فرد مورد نظر استخراج شده اند)بکار می روند به فرد فیدبک شود. وظیفه در اینجا بعنوان فعالیت u مطابق با خط مشی u=g(x) است.(یا در حالت اتفاقی آن P(u|x) ) که در ازای آن پاداش r  در یافت خواهد شد .[5]

 

شکل(5)

 

هدف از یادگیری پیدا کردن مسیری است که میزان پاداشهای جمع آوری شده در طولانی مدت را ماکزیمم کند.یک فعالیت می بایست به گونه ایی انتخاب شود که هم پاداش لحظه ایی را بگیرد و هم  پاداشهایی را که در آینده مطابق با دینامیک محیط داده می شود به خوبی جمع آوری کند. به این ترتیب عملگر یک تابع ارزشی V(X)  را فرا می گیرد که پاداشهای آنی را نیز در بر دارد.تفاوت بین پاداش پیش بینی شده و پاداش حقیقی را بصورت TD  (Temporal Difference) δ را که هم برای یادگیری تابع ارزشی V(x)و هم برای بهتر کردن خط مشی g(x)  مورد استفاده قرار می گیرد را نیز تعریف می کنیم.[5]

برای ماکزیمم کردن کردن مجموع  پاداشهای آتی با استفاده از رابطه زیر داریم:

که 0<δ<1 ضریب کاهش برای پاداشهای آتی است.استراتژی پایه اینست که در ابتدا امید ریاضی معادله بالا برای هر حالت شروع x بعنوان تابع ارزشی ، وضعیت V(x) را یاد می گیرد   و سپس برای بهتر کردن خط مشی در بازگشت به تابع ارزشی است.برای یک خط مشی داده شده توابع ارزشی حالات گذرا می بایست در معادله زیر صدق کند.

که r(t)   و  X(t+1) دینامیکهای محیطی بوده و مستقل از فعالیت U(t) هستند.با توجه به این محدودیت  معیاری را که برای  یادگیری تابع ارزشی تعریف می کنیم بصورت زیر است:

δ(t)=r(t)+γV(x(t+1))-V(x(t))

که انحراف از متوسط آن باید به صفر برسد. و این را خطای TD تعریف  می کنیم .زیرا این معادله از مشتق از  تفاضل پاداشهای آتی پیش گویی شده  تشکیل شده است.پس تابع ارزشی را بصورت زیر می توان نوشت:

که α نرخ یادگیری است.

چندین روش برای بهبود روش (خط مشی) بر اساس پاداشهای پیش بینی شده وجود دارد که مشهور ترین آنها رابطه زیر بر اساس تابع ارزش فعالیت است.

این رابطه تخمینی از اینکه چه مقدار پاداش می بایست توسط توسط فعالیت U بدست آید و متعاقب آن از روش جاری پیروی شود را بدست می دهد.که در اینصورت تابع ارزش فعالیت بصورت زیر تبدیل می شود:

پس روش پیدا کردن فعالیت باخصلت زیاده خواهی بیشتر است:

(5)

بنابراین در الگوی یادگیری TD ، خطای TD (δ) نقش دوگانه ایی را ایفا می کند.هم  سیگنال آموزش برای پیش بینی پاداش (V ) و هم برای انتخاب فعالیت(Q).البته از  TD بیشتر برای کنترل و بهینه سازی مسائلی از قبیل سیستمهای ناوبری رباتها استفاده می شود.[5]

البته در سال 1990 آشکار شد که الگوریتمهای یادگیری تقویت شده تطابق خوبی با الگوی برنامه ریزی دینامیک دارد که به آنالیزهای تئوری الگوریتمهای یادگیری کمک شایانی میکند.[6]

در حالتی که ما پیوستگی زمانی داشته باشیم  می توانیم روابط را بصورت زیر برای تابع ارزش بنویسیم:

که τ ثابت زمانی پیش بینی پاداش است.با توجه به این رابطه خطای TD بصورت زیر تعریف می شود:

که برای بروز رسانی تابع ارزش و خط مشی مورد استفاده قرار می گیرد.مزیت نوشتن فرمول بصورت پیوسته اینست که می توانیم از گرادیان تابع ارزش برای طراحی بهتر خط مشی استفاده کنیم.روابط مربوط به دینامیکهای محیطی و پاداش بصورت زیر نوشته می شوند:

سپس شرط بهینگی تابع ارزش بوسیله معادله Hamilton-Jacobi-Bellman(HJB) داده می شود.[7]

اگر دینامیکf(x,u) با در نظر گرفتن ورودی u خطی باشد و پاداش نیز مانند زیر بصورت محدب باشد:

آنگاه فعالیتی که سمت راست معادله HJB را ماکزیمم می کند عبارتست از:

اگر تابع ارزش V در معادله HJB صدق کند آنگاه یک روش کنترل فیدبک بهینه را بدست می دهد.حتی اگر تابع ارزش بهینه نامشخص باشد باز هم می توانیم از این رابطه با در نظر گرفتن تخمین جاری تابع ارزش استفاده نمود.

 

.2-2-2 مدل کرتکس

 

کرتکس عملکردهای متفاوتی را با مدارهای یکسانی انجام میدهد.اما هر منطقه یک ورودی و خروجی بخصوصی را دارد.مثلا اگر منطقه بینایی ورودی بینایی دارد ، بناچار خروجی بینایی نیز خواهد داشت.بنابراین منطقه بینایی مدارهای بینایی و منطقه شنوایی مدارهای شنوایی ندارد، بلکه همه یک نوع بخش دارند و فقط ورودی و خروجی آنها متفاوت است[8].

در یک تقسیم بندی کلی می توان کرتکس را به بخش تقسیم نمود:قسمت جلویی و پیشانی که در ارتباط با عمل و پاسخ است  ، بخش عقب که عملکرد حسی و ادراکی دارد.کرتکس اطلاعات حسی را بوسیله سیستم فرا فکنی حسی بدست می آورد[8].

با توجه به موارد گفته شده در بالا کرتکس بخشی است که ورودیها را در یافت می کند و پس از تبدیل آن به صورتهای قابل شناخت برای دیگر قسمتها(به همان صورت) آنها را به بخش مربوطه می فرستد.پس می توانیم برای کرتکس یک مدل ساده همانند شکل(6) در نظر بگیریم[6].

شکل(6)

 

که تابع تبدیل این بخش را با توجه به اینکه تغییری در نوع اطلاعات ورودی داده نمی شود می توانیم یک تابع تبدیل خطی و متغیر با زمان در نظر بگیریم.

 

3-2-2. مدل باسال گانگلیا

 

باسال گانگلیا از بخشهای زیر تشکیل شده است:هسته کودت ، پوتامین، گلوبوس پالیدوس و آمیگدالا.که بخشی از سیستم لیمبیک می باشد.سیستم لیمبیک در وسط مغز و بصورت یک ساختار مرتبط به هم و حلقه مانند ، دور بخش مرکزی مغز قرار گرفته است .در حقیقت سیستم لیمبیک از قسمتهای زیر تشکیل شده است:برجستگی سینگولت،برجستگی پاراهیپو کامپال ،آمیگدال ، هیپو کامپ،ناحیه سپتال ،هسته آکوم بنز و هسته بزالیس[8].

تحریک الکتریکی ناحیه لیمبیک باعث ایجاد پاسخهای احشایی مانند تغییرات در فشار خون ،بلع و تنفس می گردد.علاوه بر این سیستم لیمبیک با هیپو تالاموس که پیامهای زیادی از احشای درونی بوسیله NTS دریافت می کند ارتباط دارد. با این توصیف سیستم لیمبیک نیز باید عملکردی مانند هیپو تالاموس داشته باشد.یعنی پاسخهای انگیزشی و هیجانی ایجاد کند[8].

شکل(7)

 

هیپوکامپ و آمیگدال در حافظه نقش مهمی بر عهده دارند.به نظر می رسد آمیگدال خصوصا در مواردی که در ارتباط با گرایش یا اجتناب از محرکهاست نقش دارد.تحریک الکتریکی آمیگدال در حیوانات پاسخهای هیجانی مانند ترس، خشم همراه با احساسات احشایی را بوجود می آورد[8].

برجستگی سینگولت و برجستگی پاراهیپو کامپ اطلاعات تنی ، حسی ، بینایی و شنوایی را از مناطق زیادی از کرتکس دریافت می کنند و آن را به هیپوکامپ می دهندیعنی این اطلاعات را به جایی می دهند که احتمالا خاطرات وقایع در آنجا ساخته می شوند[8].

در نتایج بدست آمده از آزمایشاتfMRI مشاهده شد که ما سینگولت چپ و راست و گلوبوس پالیدوس را به عنوان نقاطی با فعالیت بیشتر داریم.در حقیقت این نقاط بخشهایی از باسال گانگلیا هستند که فعالیتش افزایش یافته است.با توجه به این مطلب برای این قسمت نیز از مدلهای باسال گانگلیا استفاده می کنیم.همانطور که می دانیم با توجه به وجود نقاط یاد گیر مغز در این ناحیه مدلهایی که برای باسال گانگلیا ذکر می شوند می بایست قابلیت یادگیری داشته باشند.در حقیقت بخش اصلی مدل Reinforcment Learning  در این بخش قرار دارد.برای این بخش مدلی همانند شکل زیر در نظر می گیریم

شکل(8)

 

این بخش شامل سیگنال ورودی ، سیگنال خروجی و سیگنال پاداش است.سیگنال ورودی این مرحله ورودی از مرحله قبل است(از قشر مخ).سیگنال پاداش برای آموزش تابع تبدیل بکار می رودکه همان نوروترانسمیتر دوپامین است که از نورونهای دوپامین ترشح می شود.مدلی که در این قسمت استفاده می شود مدل یادگیری TD (TD Learning Model) باسال گانگلیا است.

یافته های اخیر نشان می دهد که پاسخ نورونهای دوپامین در دوره یادگیری بسیار مشابه با یادگیری TD است.هدف اصلی نورونهای دوپامین باسال گانگلیا است که بین ساقه مغز و قشر مخ قرار دارد.بخش ورودی باسال گانگلیا ، استریاتوم است که ورودی دوپامینرژیک را از بخش به هم فشرده جسم سیاه دریافت می کند.

استریاتوم از دو بخش تشکیل شده است استریو سوم و ماتریس.که استریوسوم بخش ورودی است و به نورونهای دوپامینرژیک در SNc مرتبط می شود.وماتریس به بخش شبکه ایی جسم سیاه(SNr) و گلوبوس پالیدوس GP))مرتبط می شود.که خروجی آن به ساقه مغز و طریق تالاموس به قشر مخ می رود.که این دو بخش ساختار شکلی یادگیری TD را به  یاد ما می آورد.که یکی برای پیش بینی پاداش و دیگری برای انتخاب فعالیت است.

مدار باسال گانگلیا می تواند یادگیری TD  را بصورت زیر انجام دهد (شکل 9).

 

 

 

شکل (9)

 

وضعیت محیط و سابقه و مفهوم  یک وظیفه در قشر مخ بازنمایی می شود و با X  نشان داده میشود.تابه ارزش حالت V(x)   در استریوسوم آموزش دیده است.در حالیکه تابع ارزش Q(x,u) در ماتریس آموزش دیده است[5].یکی از گزینه های مناسب برای انتخاب فعالیت u که در خروجی مسیر باسال گانگلیا قرار دارد بوسیله رقابت در ارزش فعالیتها طبق رابطه (5)  گزینش می شود.بر اساس نتیجه سیگنال پاداش r و تابع ارزش وضعیت جدید، خطای TD (δ) برای شروع آتش نورونهای دوپامین در جسم سیاه ، فرستاده می شود.که خروجی آنها به استریاتوم باز خورد می شود و بعنوان سیگنال یادگیری هم برای تابع ارزش حالت V(x) و هم تابع ارزش فعالیت Q(x,u) در استریاتوم مورد استفاده قرار می گیرد.البته باید توجه کرد که موارد مبهمی نیز در مدل یادگیر ی TD باسال کانگلیا وجود دارد .مثلا اینکه تفاوت گذرای تابع ارزش V در مدار مرتبط با استریاتوم چگونه محاسبه می شود.

 

.2-2-4 مدل آمیگدال

د راینجا ما به مدلسازی آمیگدال می پردازیم.دلیل اینکه چرا ما در این بخش این کار را انجام میدهیم هم به این علت است که در تصویر برداریهای fMRI فعالیتهایی در اطراف آن مشاهده شده است و هم اینکه همانطور که در بخش قبل گفته شد ما در انتخاب وضعیتV(x) و انتخاب فعالیت Q(x,u)بحث رقابت را داریم.انتخاب یک فعالیت یا یک وضعیت بسته به میزان ارزش آن است که طبق رابطه (5) انجام میشود.در اینجا ما برای آمیگدال نقش ارزش گذاری فعالیت یا وضعیت را قائل هستیم لذا با توجه به ارتباط آن با سایر قسمتها برای آن مدلی ارائه می دهیم.

اخيراً بيان شده که وابستگي بين محرک و اثرات احساسي آن در مغز در قسمت آميگدالا رخ مي دهد. در اين ناحيه به طور گسترده اي به آناليز محرکهاي رسيده به قشر حسي مغز و همچنين تالاموس و تعيين ارزش احساسي هريک پرداخته مي شود. شواهد موجود بر اين باور است که پردازش صورت گرفته به صورت يادگيري شرطي مي باشد[10].

نتايج اين يادگيري به قسمتهاي ديگر مغز مانند هيپوتالاموس که واکنش هاي احساسي را ايجاد مي کند فرستاده مي شود. نقش آميگدالا نسبت دهي ارزش احساسي هريک از محرک ها بر اساس تقويت کننده (reinforcer) اوليه است[10].

همانطور که در شکل(10) ديده مي شود چندين قسمت ديگر مغز نيز در اين رابطه با آميگدالا در ارتباط هستند. مخصوصاً تالاموس، هيپوکامپ و قشر orbitofrontal که به عنوان ورودي و خروجي به آميگدالا عمل مي کنند.

شکل(10)

 

آميگدالا با وجود اندازه کوچک خود، داراي ساختار پيچيده اي مي باشد و لايه هاي متعددي از اتصالات را با ساير قسمتها دارد:

  • داده هاي خود را از قسمتهاي حسي قشر مغز دريافت مي کند.
  • خروجي خود را به وسيله اتصالات متعدد به هيپوکامپ، هيپوتالاموس، OFC مي دهد.
  • در نتيجه کلاً سيستم به صورت توليد کننده punishment و reward عمل مي کند. آنچه که آميگدالا را مهم مي کند، قابليت آن در پيوند بين تحريکات احساسي و محرک هاي خنثي است. بطوريکه اگر يک تحريک خنثي در نزديکي يک تحريک احساسي رخ دهد، اين تحريک مي تواند به توليد واکنشهاي مشابه بپردازد. (يادگيري شرطي)[10]

با توجه به موارد گفته شده می توان اینگونه برداشت کرد که آمیگدال مسئولیت تولید سیگنال پاداش را با توجه به ورودیهای خود دارد(سیگنال پاداش درشکل 8).در حقیقت می توان اینگونه گفت که آمیگدال ارتباط مسقیم با آتش کردن نورونهای دوپامین دارد و به نوعی علت اصلی تولید دوپامین در این سلولها است. همانطور که در بخشهای قبلی نیز گفته شد ورودی این بخش به خروجی بخش قبلی (قشر مخ) متصل است.

در مورد مدلهای محاسباتی که برای آمیگدال ارائه شده اند ما به ذکر یکی از آنها بر اساس مرجع شماره[10]و[11] اکتفا می کنیم.

در اینجاارتباطات بين تالاموس و قشر حسي مغز را  با آميگدالا به عنوان محرک ها در نظر گرفته ايم و با S نمايش مي دهيم. در آميگدالا بازاي هر محرک يک گره A وجود دارد. براي کليه خروجي هاي مدل نيز يک گره خروجي وجود دارد که E ناميده مي شود. اين گره به طور ساده اي خروجي گره هاي موجود در OFC را از خروجي گره هاي آميگدالا کم مي کند. براي هر گره A يک ضريب پلاستيسيته V وجود دارد و روابط در آميگدالا به شرح زير است:

 

 

ضرايب V به نسبت اختلاف موجود بين تقويت کننده و فعال سازي گره هاي A تنظيم مي شود. پارامتر  پارامتر نرخ يادگيري است که بين 0 و 1 مي باشد:

سيگنال پاداش (reward) از قسمتهاي مختلف مي تواند سرچشمه مي گيرد مانند تالاموس، هيپو تالاموس يا عقده هاي قاعده اي که در اين مدل تمام منابع در يک ورودي R خلاصه شده است.

در اینجا برای مدل تنها یک خروجی در نظر گرفته می شود که البته فرض درستی نیست.(شکل 11)

 

شکل(11)

مدلی که در بالا برای آمیگدال ذکر شده است دارای معایب زیادی است ولی این مزیت را هم دارد که به دلیل سادگی می تواند بسیار پر کاربرد باشد.

.2-2-5 مدل مخچه

مطالعات تصویری مغز نشان می دهد که برخی از بخشهای مخچه و نواحی قشری مغز که ورودیهایی از مخچه در یافت می کند در هنگام تصور حرکت نیز، فعالیت دارند[12].

در مطالعات fMRI انجام شده بر روی سوژه هایی که فعالیت بیو فیدبک را انجام میداده اند نیز این فعالیت نیز مشاهده شده است[4].با توجه به نتایج بدست آمده می توان اینگونه استنباط کرد که سوژه ها در هنگام انجام بیوفیدبک ریلکسیشن از تصاویر ذهنی کمک می گرفته اند که مربوط به حرکت بوده است و این موجب فعال شدن مخچه و ظاهر شدن آن در تصاویر شده است.

البته ناحیه پل ساقه مغز قسمت پشت پلها و قسمت شکمی مخچه شامل مدارهایی می گردد که در حرکت بدن در فضا (قدم زدن ، دویدن، شنا کردن و غیره ) و در کنترل کردن ماهیچه های چشم و تشخیص جهت صدا مهم هستند.همچنین تمام ناحیه به مقدار زیادی در خواب و رویا نقش دارد[8]. این مطلب می رساند که فعالیت مخچه فقط منوط به انجام عمل حرکتی یا تصور آن نمی باشد بلکه هر تصویر ذهنی که به نوعی با سوژه در ارتباط باشد می تواند موجب فعالیت آن گردد.

اما سئوال اینست که وظیفه مخچه چیست.وظیفه ایی را که محققین برای مخچه متصور هستند ایجاد مدل داخلی بدن و محیط و ذخیره آنهااست.که چندین دلیل و مدرک برای این اینکه مخچه برای این کار مورد استفاده قرار می گیرد وجود دارد.اول اینکه آسیب به مخچه اغلب منجر به مشکل حرکتی مخصوصا در حرکات بالیستیک و سریع می شود.و دوم اینکه آناتومی و فیزیولوژی مخچه بگونه ایی است که برای یاد گیری مدلهای داخلی بسیار مناسب است.

در این بخش ما به ارائه مدلهای مربوط به مخچه می پردازیم و نحوه مدلسازی آن را ارائه می کنیم.با توجه به داده های آناتومیکی و فیزیولوژیکی مدل یادگیری زیر برای مخچه پیشنهاد می شود.موضوعی که می بایست مدل شود، مثلا  دینامیک یا سینماتیک حرکت دست  نگاشت هدف را تعیین می کندX→Y . بعنوان مثال X دستور موتوری وY نتیجه سنسوری است.سیگنال ورودی X  بصورت یک ورودی فیبر خزه ایی است که در طبقه میانی آن را با bj(X(t))  نمایش می دهیم(تبدیل شده آن در سلولهای گرانول).سپس خروجی سلول پورکینیه بوسیله مجموع سلولهای گرانول bj(X(t))  در وزنهای سیناپسی ωi ضرب می شود مثلا:

الگوریتم یادگیری این وزنها را بوسیله تولید خطای خزوجی و ورودی به روز رسانی می کند.

کهα سرعت یادگیری است. این یادگیری می تواند توسط پلاستسیته سیناپسی سلول پورکینیه در صورتیکه سیگنال خطای مناسب y^(t)-y(t) فراهم شود، انجام گیرد.

شکل 12 شماتیک ارتباطات مخچه با سایر نقاط مغز را نشان میدهد.

شکل (12)

 

 

در این بخش ما از مدل آقای Kawato  برای مدل کردن مخچه استفاده می کنیم.که شمایی از مدل یادگیری فیدبک-خطا در شکل (13)  دیده می شود.ما نیز از این مدل برای مدلسازی این قسمت از مغز استفاده می کنیم.

شکل(13)

 

این مدل از یک کنترل کننده فیدبک تشکیل شده که پایداری سیستم را تضمین می کند و یک کنترل کننده Feedforward تطبیقی که فرایند کنترل را بهبود می دهد.خروجی کنترل کننده فیدبک توسط رابطه زیر داده می شود:

که Y(t) خروجی واقعی سیستم است.ایده کلیدی در یادگیر ی خطای فیدبک استفاده از خروجی کنترل کننده فیدبک ufb بعنوان سیگنال خطا برای کنترل کننده Feedforward تطبیقی است:

خروجی کنترل بوسیله مجموع هر دو کنترلر داده می شود:

اگر یادگیری کامل شود یعنی y(t)=yd(t) آنگاه کنترلر Feedforward (G) باید بصورت معکوس F-1 سیستمy=F(u) شود.همانطور که دیده می شود در این مدل نیز ما به نحوی فرایند یادگیری را که همان کسب مهارت باشد داریم.

 

.2-3 مدل بیوفیدبک پس از رسیدن فرد به مهارت

 

در این حالت دیگر مسیر فیدبک خارجی قطع می شود. در این حالت میتوانیم مدلسازی سیستم بیو فیدبک را با ساده ترین نوع کنترل بالستیک مدلسازی نمود.حرکت بالستیک نوعی حرکت است که در آن برنامه ایی دقیق و از پیش تنظیم شده و بدون استفاده از سیستم پسخورد  مسئولیت حرکت و کنترل آنرا بر عهده دارد.بعبارت دیگر ما یک فعالیت از پیش برنامه ریزی شده را داریم. در اینگونه فعالیت پس از ارده نمودن فعالیت، مجموعه ای از الگو ها و دستور العمل ها  به ترتیب و به تدریج در طول زمان و در مکانهای خاص به عملگرها  ارسال شده و تحقق می یابد. و پس انجام فعالیت اراده شده ، کنترل ثانوی و با استفاده از پسخوراند انجام نشده بلکه عملکرد کنترلی اینگونه از فعالیتها بر پایه روند محاسباتی و کنترل ابتدایی پایه ریزی شده است و کنترل لحظه به لحظه و بر مبنای موقیت های مختلف به سیستم اعمال نمی گردد.شکل زیر شمایی از یک حرکت یا فعالیت بالستیک است.

شکل(14)

 

 

هر چند که این مدل کیفی معایب بسیاری دارد (از جمله حساس بودن نسبت به اغتشاش و اینکه مغز نمی تواند تمامی الگو ها را در خود ذخیره کند) اما در صورتیکه فعالیتی برای انسان کاملا ماهرانه شد چون سیستم کنترل بصورت مدار باز عمل می کند و از برنامه تهیه شده و ذخیره شده در مغز برای کنترل سود می جوید لذا نحوه کنترل مشابه با کنترل حرکات بالستیک خواهد شد.مدل کنترل بالستیک آن چیزی است که پس از بدست آمدن مهارت حاصل می شود.

برداشت دیگری که می توان از کسب مهارت در فرایند بیو فیدبک داشت اینست که در این حالت دیگر فیدبک خارجی وجود ندارد و حذف می شود در این حالت مدل یادگیری تقویت شده(Reinforcment Learning) دیگر مسیر فیدبک ندارد و ما شکل زیر را خواهیم داشت:

شکل(15)

نکته ایی که می بایست در اینجا به آن توجه شود اینست که هرچند در اینجا مسیرهای فیدبک خارجی قطع شده اند ولی ما هنوز هم سیگنال پاداش را برای تابع ارزشی داریم.که در مورد مدل یادگیری TD این موضوع توسط آزمایشی به اثبات رسیده است[5].در این حالت تابع ارزشی ما دیگر متغیر با زمان نخواهد بود و به یک مقدار بهینه رسیده و در آن ثابت باقی می ماند

V(X(t))=E[r+γV]

و

δ(t)=r+ V(γ-1)

 

همانطور که مشخص است در اینجا انتخاب یک فعالیت از بین چند تا انجام نمی شود بلکه فقط یک گزینه برای انتخاب وجود دارد. که در صورتیکه شخص اراده و قصد انجام آن فعالیت را داشته باشد با توجه به اینکه آموزشها دیده شده است و مهارت کسب شده  مدل مربوط به آن فعالیت فراخوانی شده و بر طبق آن ، فعالیت مورد نظر انجام خواهد گرفت.در اینحالت نرخ یادگیری به سمت صفر میل کرده و بسیار کوچک است.بنحوی که می توان از آن صرف نظر نمود.

 

 

 .2-4بهبودی و تغییر نقطه کار

در بخشهای قبل مدلهایی برای بیوفیدبک پیش از رسیدن فرد به مهارت و همینطور پس از کسب مهارت ذکر شد. ولی هدف نهایی بیوفیدبک چیست.آیا رسیدن به این نقطه که فرد بدون گرفتن فیدبک خارجی و صرفا با استفاده از یک ورودی اختیاری(اراده کردن) بتواند یک تابع بیولوژیکی را کنترل کند کافیست؟ البته مسلما هدف نهایی بهبودی کامل است که ما معتقدیم در بیو فیدبک این کار انجام میشود.اما برای توضیح اینکه چگونه این فرایند اتفاق می افتد می توان اینگونه تعبیر کرد که پس از هر بار تغییر وزنهای شبکه توسط یک فرد شبکه دوباره به حالت اولیه به طور کامل باز نمی گردد.بعبارت دیگر ما یک ضریب فراموشی را برای بازگشت به حالت اولیه در نظر می گیریم.بنابراین اگر در وضعیت اولیه ما φ(ωi) را داشته باشیم پس از تکرار وظیفه بیو فیدبک ، این وزنها تغییر می کند و به سمتφ(ωs)  که حالت مطلوب و مورد نظر است میل می کند. که رابطه زیر می تواند این مورد را بیان کند:

φ(ω)= [φ(ωi)+αn φ(ωs)]/n+1

که در این رابطه α ضریب همگرایی است.یعنی میزان نزدیک شدن ما به وزنهای بهینه.این ضریب را از این جهت در نظر گرفتیم که ما همانطور که به وضعیت قبلی بطور کامل باز نمی گردیم به وضعیت جدید نیز بطور 100% نمی رسیم.البته این رابطه بصورت نظری بیان شده و در عمل ممکن است اینگونه نباشد و ضرایب متفاوت باشند، ولی چیزی که برای ما معلوم است اینست که ما تغییر تدریجی وزنها را خواهیم داشت.

 

 

 

 

 

 

 

بخش سوم

 

 .3-1نتایج

در بیوفیدبک دو فرایند انجام می شود. یکی  یادگیری انجام یک فرایند و دوم انجام یک فعالیت مرتبط با آن  است.که این دو از یکدیگر جدا نشدنی و همراه هم هستند و بصورت همزمان انجام می پذیرد.در بیو فیدبک  فعالیت می تواند کنترل یک تابع بیولوژیکی و یا حتی یک حرکت ساده دست یا پا باشد.ما در اینجا از مدل یادگیری تقویت شده برای مدل کردن بیوفیدبک استفاده کردیم.پس از آن با توجه به بلوکهای موجود در مدلمان قسمتهایی از مغز را که مرتبط با این مدل بوده باز کرده و مدلهای مربوط به آنها ارائه شد که این بخشها به ترتیب عبارت بودند از :قشر مغز، باسال گانگلیا ، آمیگدال و مخچه.

همچنین مدلهای مرتبط با بیوفیدبک پس از رسیدن فرد به مهارت و پس از اینکه یک فرد آموزش می بیند و دیگر نیازی به فیدبک خارجی ندارد ارائه کردیم ، که در اینجا دو مدل مشابه که در حقیقت یک مدل هستند یعنی مدل یادگیری تقویت شده بدون مسیر فیدبک خارجی و مدل بالیستیک را استفاده کردیم.روابط مربوط به این قسمت نیز با توجه به روابطی که برای قسمت اول ارائه شده بود بیان شد.

در مورد اینکه بهبودی در بیو فیدبک چیست و چگونه حاصل می شود و اینکه وزنهای شبکه عصبی ما در حالت بهبودی به مقدار مطلوب تغییر می کند نیز بحث شد.رابطه ایی نیز برای آن در انتها ذکر گردید.

 

 .3-2بحث ونتیجه گیری

در مورد تکنیک درمانی بیو فیدبک تا کنون مدلهای چندانی ارائه نشده است. این پروژه با هدف توسعه هرچه بیشتر این روش درمانی ، که نسبت به روشهای متداول دیگر عوارض بسیار کمتری دارد ، صورت گرفته است.البته با توجه به کمی تحقیقات انجام شده در این زمینه و نبود داده های لازم امکان مدلسازی بیوفیدبک در حد مطلوب فراهم نشد.لیکن قدمی هرچند کوتاه در مسیری بلند بر داشته شد.

ما در اینجا با استفاده از مدلهای سیستمهای عصبی-عضلانی به مدلسازی بیوفیدبک اقدام کردیم.در نظر اول شاید تفاوتهای بسیاری بین بیو فیدبک و سیستمهای عصبی- عضلانی به نظر برسد ولی اگر با نگاه موشکافانه تری به قضیه بنگریم مشاهده می کنیم که ایندو با هم نقاط مشترک فراوانی دارند که وجود یادگیری در هردو یکی از این نقاط اشتراک است و این استفاده از مدلهای یکی را برای دیگری ممکن می سازد.

کارهای انجام شده قبلی در این زمینه در مرجع[3] آورده شده است، که با توجه به اینکه اولین کار در این زمینه بوده است دارای ایراداتی می باشد که از آنجمله می توان به کامل نبودن آن و اینکه مدل ارائه شده فاقد سیگنال پاداش بود اشاره کرد.در فرایند یادگیری یکی از مهمترین ورودیها به سیستمها سیگنال پاداش یا تنبیه است که موجب یادگیری(توسط ارزش گزاری روی که فعالیت یا وضعیت) و به خاطر سپاری می شود.در صورتیکه ورودی مذکور وجود نداشته باشد، عمل یادگیری در مغز یا انجام نمی شود و یا اینکه به سرعت از ذهن محو می شود.ما با در نظر گرفتن ورودی پاداش و فیدبکهای محیطی مدل یادگیری تقویت شده را برای بیوفیدبک پیشنهاد کردیم.به دنبال آن برای بخشهایی که مرتبط با این مدل متصور بودیم و نتایج fMRI آن را تایید می کرد ، مدل مناسبی ذکر شد.این پروژه بر استدلالات منطقی و داده های fMRI مربوط به بیوفیدبک ریلکسیشن در توصیف و بیان مدلها ، تکیه دارد.هرچند که شاید در بخشی از موارد این مدلها و توصیفها نتوانند بطور کامل فرایند بوقوع پیوسته را شرح دهند.

دادهای fMRI بدست آمده حاکی از این مطلب بود که در بیو فیدبک نیز نقاطی از مغز مشابه با هنگامیکه یک فعالیت حرکتی و عضلانی صورت می گیرد ، شروع به فعالیت می کنند.البته توضیح این مطلب که چگونه ایندو در این مورد خواص به هم نزدیک هستند بسیار ساده می تواند باشد و آن اینست که سوژه ها در هنگام انجام عمل بیوفیدبک ریلکسیشن احتمالا از تصاویر ذهنی مرتبط با حرکت کمک می گرفته اند که این امر موجب نزدیکی و مشابهت ایندو فرایند به یکدیگر شده است.البته با توجه به موارد گفته شده ما انتظار نزدیک بودن این دو را جدای از مطلبی که گفته شد،داریم.حتی در برخی موارد که ما فیدبک حرکت را برای انجام فعالیتهای حرکتی داریم می بایست از مدلهای عصبی عضلانی برای این منظور استفاده کنیم.با توجه به این موارد می توانیم بگوییم راهی  را که در این پروژه پیموده ایم تا حد زیادی  می تواند صحیح باشد.

در اینجابرای ادامه کار در این زمینه و برای اثبات صحت درستی  نتایج بدست آمده می بایست اعتبار این نظریات    اثبات شود.

در این پروژه هدف ما انجام عمل ریلکسیشن و رسیدن به آرامش خواهد بود. در این راستا ما می توانیم با استخراج ویژگیهای گلوبال نظیر : مولفه لیاپانوف ، بعد فراکتال  و بعد همبستگی یک حالت واحد را برای مغز قبل از عمل بیو فیدبک مشخص کنیم .که این حالت را در فرد به عنوان حالت مریضی در نظر می گیریم(در صورتیکه فرد مورد نظر دارای مشکل عدم آرامش باشد).

در این جا ما معتقدیم که فرد می تواند بصورت اختیاری و در صورتیکه فیدبکهای مناسب به وی اعمال شود این ویژگیها را تغییر دهد.که ما در اینجا از فیدبک EEG به این منظور استفاده خواهیم نمود. با توجه به این مطلب مشخص است که ما ویژگیها را از روی سیگنال EEG استخراج می نماییم.اما با توجه به اینکه ریلکسیشن ، هم در سیگنال EEG نمود پیدا می کند و هم در سایر پاسخهای بدنی مانند EDA و ضربان نبض و… ، می توان این موارد را نیز  به فرد فیدبک کرد.

بردار حاصل از استخراج این پارامترها می تواند حالات گوناگون مغزی را برای ما مشخص کند که در این حال ما می توانیم هم برای حالات مغزی قبل از انجام بیو فیدبک و هم بعد از آن یک حالت متناظر داشته باشیم. همچنین در هنگامیکه فرد عمل بیو فیدبک را انجام می دهد انتظار داریم نوروترانسمیتر دوپامین بیشتری نسبت به حالت عادی ترشح شود که این نیز قابل اندازه گیری است و وجود سیگنال پاداش را اثبات می کند.

همچنین با توجه به ماهیت مشخصه هایی که قصد اندازه گیری آنها را داریم می توانیم انتظار داشته باشیم که این مولفه ها کاهش یابند. و این به این خاطر است که ما برای مغز در حالت نرمال  یک حالت آشوب گونه در نظر می گیریم و بیماری را نوعی سنکرون شدن در بخشی از مغز می دانیم پس توقع داریم که با حرکت در سمت صحیح و پیشرفت به سوی بهبودی مجددا به حالت آشوب گونه باز گردیم.

آنچه که ما در اینجا – با توجه به بحثهای نظری انجام شده – انتظار آنرا داریم اینست که در هر بار انجام این تمرینات به درصدی از بهبودی دست پیذا کنیم. به این ترتیب که بردار مولفه استخراج شده را در هر جلسه تمرین تا آنجا که مقدور باشد به سمت حالت مورد نظر هدایت می کنیم. پس اتمام هر جلسه در انتها این بردار به حالت اولیه اما نه بطور کامل باز خواهد گشت که طبق نظریات ارایه شده بعد از چند ین جلسه تمرین یک سوژه باید به درصدی از تغییر در حالت مغزی بطور دائم دست پیدا کند.

در نهایت ما با این روش انتظار دست یافتن به سه هدف و در حقیقت اثبات آنها را داریم:

  • اول اینکه در بیو فیدبک ما قادر به تغییر حالت مغز حتی به مقدار کم بصورت دائمی هستیم( رسیدن به بهبودی و سلامت).یعنی باقی ماندن فرد در حالت مغزی مناسب.
  • دوم اینکه با نبود فیدبک خارجی فرد می تواند خود را به حالت مغزی مناسب برساند.(حذف مسیر فیدبک خارجی پس از رسیدن فرد به مهارت).
  • سوم ، بررسی تغییر حالت مغز در بیو فیدبک است که ما به آن معتقدیم واینکه این تغییر آیا بصورت پیوسته اتفاق می افتد یا بصورت پله ایی.

همچنین ما قادر به بررسی اینکه در هر بار انجام بیو فیدبک ریلکسیشن چه مقدار تغییر در حالت مغزی را داریم خواهیم بود. و این نکته از این جهت حائز اهمیت است که می تواند  میزان کارایی این روش درمانی و اینکه آیا ما واقعا می توانیم به نقطه کار بهینه برسیم یا نه را برای ما تبیین میکند.

 

مراجع

 

 

[1]  هاشمی گلپایگانی. محمد رضا “درس سیستمهای عصبی-عضلانی”

[2] غفاری احمد ،خلیل زاده محمد علی. ” بررسي الكتروفيزيولوژي EEG در بيوفيدبك ريلكسيشن” پروژه درس الکتروفیزیولوژی (1376)

[3] Nishimura.C et al. “A mathe matical model of biofeedback and its relation to the neural activity”  The 3rd European Medical and Biological Engineering Conference(2005)

[4]Kritchely H.D et al. “Brain activity during biofeedback relaxation a functional neuro imaging investigation” Oxford university press (2001)

[5] Kenji Doya et al. “Neural mechanisms of learning and control” IEEE control system magazine(2001)

[6]  D.P. Bertsekas and J.N. Tsitsiklis, Neuro-Dynamic Programming. Belmont,

MA: Athena Scientific, 1996.

 

[7]  W. Schultz, P. Dayan, and P.R. Montague, “A neural substrate of prediction

and reward,Science, vol. 275, pp. 1593-1599, 1997

 

[8] رابرت .بی.گراهام. ترجمه: دکتر علی رضا رجایی و علی اکبر صارمی “روانشناسی فیزیولوژیک” چاپ سوم 1384 ص(104 تا 126).

[9]  J.C. Houk, J.L. Adams, and A.G. Barto, “A model of how the basal ganglia generate and use neural signals that predict reinforcement,” in Models of Information Processing in the Basal Ganglia, J.C. Houk, J.L. Davis, and D.G.

Beiser, Eds. Cambridge, MA: MIT Press, 1995, pp. 249-270.

 

[10] آدرنوش.مهدی و هاشمی گلپایگانی محمد رضا و خلیل زاده محمد علی.”شبیه سازی مدل محاسباتی یادگیری احساسی در آمیگدالا” تابستان 1383.

 

[11]  Jan Moren, Christian Balkenius,”A Computational Model of Emotional Learning in the Amygdala”, Lund University Cognitive Science 2000.

[12]  M. Lotze, P. Montoya,M. Erb, E. Hulsmann,H. Flor,U. Klose,N. Birbaumer,and W. Grodd,“Activation of cortical and cerebellar motor areas during executed and imagined hand movements: An fMRI study,” J. Cognitive Neurosci.,vol. 11, pp. 491-501, 1999.