بیوفیدبک ریلکسیشن
بیوفیدبک ریلکسیشن
بیو فیدبک تکنیک بدست آوردن توانایی خود تنظیمی یک تابع بیو لوژیکی است. که معمولا بطور طبیعی نا خود آگاهانه است.که بصورت(1) یک مسیر اطلاعاتی خارجی با فیدبک کردن شرایط فیزیولوژیکی داخلی به یک حس دیداری یا شنیداری (2) یادگیری ذهنی در سطح هشیاری با اطلاعاتی که از حواس در یافت می شود.(3) بدست آوردن احتمال توانایی برای کنترل اختیاری شرایط داخلی بدون مساعدت مسیر خارجی مشخص می شود.اگر چه بیو فیدبک بطور گسترده در بیماریهای روان تنی مورد استفاده است و اثرات مثبت آن تایید شده است .ولی پایه های عصبی آن هنوز نا شناخته است.
در این قسمت مسئله بیو فیدبک با بررسی عوامل دخیل در آن و از دیدگاه کنترلی در شرایط مختلف و متنوع با الهام از سیستمهای عصبی عضلانی مورد بررسی قرار می گیرد.
از نظر تقسیم بندی بیو فیدبک را می توان به دو دسته تقسیم نمود:
1-بیو فیدبک ارادی
2- بیو فیدبک غیر ارادی
بیو فید بک غیر ارادی به آن قسم از بیو فیدبکهایی گفته می شود که مسیر فیدبک آن یا داخلی بوده و از طریق سنسوریهای داخل بدن یا حس بینایی ، شنوایی و… تامین می شود اما فرد بطور آگاهانه سعی در تصحیح فرایند بیو لوژیکی ندارد.که بعنوان مثال می توان انواع حرکتهای رفلکسی را نام برد.
اما بیو فیدبک ارادی به آندسته از بیو فید بکی گفته می شود که تحت تاثیر خواست اراده و تصمیم شخص شروع و کنترل می شود و مسیر فید بک خارجی در آن وجود دارد که از طریق حواس پنج گانه مسیر آن بسته می شود.
در اینجا بحث ما بر روی بیو فید بک ارادی است که آن را می توان تعاملی بین آنچه که مغز برای کنترل برنامه ریزی کرده و آنچه که از طریق پسخورهای محیطی به آن وارد می شود در نظر گرفت.البته هر عملی پس از رسیدن فرد به مهارت ، تبدیل به یک سیستم کنترل حلقه باز می شود.پس در ابتدا سیستم بصورت یک سیستم حلقه بسته بوده و سپس به صورت حلقه باز در می آید.در نوع حلقه بسته ما یک ورودی مرجع و یک فیدبک کنترلی جهت تثبیت وضعیت مطلوب داریم و از نظر کنترلی یک سرو سیستم کامل می باشد.که هم ورودی آن و هم بر خی از پارامتر های داخلی اش توسط سیستم مر کزی اعصاب کنترل میشود.در این الگو میزان یکی از پارامتر ها مانند EEG ،GSR ،ضربان نبض و … توسط فیدبکهای حسی به گونه ایی مناسب به فرد اطلاع داده می شود و فرد با توجه به آموزشهایی که در ضمینه تنظیم بدنی خود (خواه توسط خود فرد کسب شده باشد خواه به وی آموزش داده شده باشد.) دارد ، با توجه به این ورودی سیستم مورد نظر را کنترل می کند.مثلما در این مسئله عوامل روحی و روانی و اغتشاشات محیط خارج بی تاثیر نیستند.در اینجا می توان از مدلهای ارائه شده در حرکتهای تعقیب کنایی با مرجع ذهنی که در آن فرد با توجه به فیدبک داده شده و آموزشی که از قبل دیده است هدفی را در ذهن خود تجسم کرده و سپس سعی در دنبال کردن آن می نماید استفاده نمود.[1]
اما در حالتی که فرد به مهارت دست پیدا می کند نیازی به فیدبک جهت اصلاح وضعیت خود ندارد.این مهارت بعلت بهره گیری صحیح از حافظه پیش برنامه ریزیهای دقیق و مناسب مغزی برای کنترل سیستم معیوب و نیز تنظیم مناسب سیستمهای فیدبک داخلی می باشد.
اما به عنوان غایت نهایی این فرایند می توان حالتی را در نظر گرفت که نقطه کار سیستم آسیب دیده به حالت عادی باز گشته یا تراژکتوری در بستر جذب مناسب در حرکت می باشد.
اما اصلی که در اینجا ما به آن معتقدیم اینست که ما در بیو فیدبک همیشه نمی توانیم تابع اصلی کنترلی را که فرایند مورد نظر راکنترل می کند بطور مستقیم تحت کنترل در بیاوریم بلکه کاری که در بیو فیدبک انجام می شود تغییر وزنهای شبکه عصبی مغز است که در نهایت موجب می شود که عملکرد کلی بهبود پیدا کند.یعنی هرچند که ما بخش دیگری از مغز را به صورت عمده برای در مان تحت کنترل در می آوریم لیکن با توجه به ارتباطی که این بخش با بخشهای دیگر و مخصوصا بخش کنترل کننده تابع بیولوژیکی مورد نظرما بخشی که نقطه کار آن تغییر کرده است)دارد و همچنین تعاملاتی که این دو بخش دارند، در نهایت ما یک بهبود رفتار در این قسمت را خواهیم داشت.بعبارت دیگر تغییر در یک وزن شبکه عصبی در نهایت موجب تغییر در وزن قسمتهای دیگر می شود که تابع بیولوژیکی مورد نظر ما نیز جزء آنهاست و ما را به هدف مورد نظر می رساند.
در حقیقت ما با تغییر در یک بخش موجب تغییر state مغز و به تبع آن تغییر در رفتار قسمتهای مختلف می شویم .در اینجا ما با استفاده از داده های آزمایشات fMRI نشان می دهیم که در بیو فیدبک فقط تغییر در یک تابع بیولوژیکی اصلی برای تغییر یک فرایند لازم نیست بلکه با ایجاد تغییر در بخشهای دیگر مغز که مرتبط با آن تابع هستند نیز می توان این کار را انجام داد. پس از آن با استفاده از الگوها و مدلهایی که برای سیستمهای عصبی عضلانی موجود است به مدلسازی بیو فیدبک می پردازیم.
در این جا برای مدلسازی بیو فیدبک به مدلهای شبکه های عصبی عضلانی استناد می کنیم و به دو دلیل این کار دارای ایراد نمی باشد:
- با توجه به اینکه گونه ایی از بیو فیدبک که برای توان بخشی مورد استفاده قرار می گیرد عملا بحث سیستمهای عصبی عضلانی و در آنها مطرح میشود و فیدبک حرکات را در آنها داریم لذا می توان از مدلهای مربوط به سیستمهای عصبی عضلانی در این بخش برای مدلسازی بیوفیدبک استفاذه کرده وآنها را بصورت یک مدل کلی به بیو فیدبک تعمیم دهیم. البته شاید این نوع مدلسازی ، در برخی از انواع مدلهای بیو فیدبک جوابگو باشد ولی با توجه به اینکه به نوعی بخشی از جنبه های بیو فید بک را مدل کرده است می توان با برخی تعمیم ها پاسخگوی انواع دیگر نیز باشد.
- هرچند که مدلهای سیستمهای عصبی عضلانی در مورد کنترل حرکات هستند ولی اکثر کارهایی که انسان انجام می دهد از یک الگوریتم خواص پیروی می کند و همچنین با توجه به اینکه این مدلها بصورت کلی عنوان شده اند لذا تا حدی می توانند در این مورد خاص نیز بکار روند که ما در جای خود به دلیل استفاده از مدلهای آورده شده ، اشاره می کنیم.
3-در بیو فیدبک ما یادگیری را برای سوژه ها متصور هستیم که در این حالت از مدلهای مربوط به فرایند یادگیری که بین بسیاری از فرایندهای ذهنی مشترک است می توان استفاده نمود.که می توان تشابهاتی را با دیگر فرایندها برای آن قائل بود.
بخش اول
- (ثبت داده)[2]و[4]
فعاليت الكتريكي پوست ناشی از تحريكات سمپاتيك غدد عرقي eccrine پوست است که موجب تغيير كندوكتانس جريان اعمال شده ميشود. EDA هم حوادث زودگذر سريع (كه پاسخ كندوكتانس پوست ناميده ميشود) وهم جابجايي تدريجي در سطح اصلی (سطح كندوكتانس پوست) را منعكس ميكند. فعاليتهاي سمپاتيكي به حالتهاي شناختي و احساساتي مرتبط است و EDA به طور گستردهاي براي شاخص حساسيت برانگيختگي جسمي مربوط با احساسات توجه مورد استفاده است (وناپل و كريستي 1980) همچنين شواهدي وجود دارد كه اثبات ميكند برانگيختگي سمپاتيك كه خود را در EDA نشان ميدهد ميتواند براي تأثير در حالتهاي هيجاني و فرآيندهاي شناختي از قبيل تصميمگيري و حافظه بازخورد شود.(دامايسو 1991)
نقش فعاليت خودكار وابسته به هيجان و پيامدهاي پاتوفيزيولوژيكال اختلالات استرس و اضطراب از موضوعات مهم كلينيكي است.
سطوح بالاي تحريكات سمپاتيكي نشانه اختلالات اضطرابي و استرسي هستند. و در پی آن مداخلاتی كه تحريك خودكار سطح پاييني را در كاهش استرس و اضطراب و افزايش حال خوب ايجاد ميكند. در ميان اين تكنيكها، بيوفيدبك ريلكسيشن به سوژهها اجازه تأثير بر فعاليت خودكار را به طور اختياري با تهيه فيدبك realtime مثلا توسط EDA ميدهد بيوفيدبك ريلكسيشن در مورد سوژههايي كه كاهش تحريكات سمپاتيك را فرا ميگيرند ممكن است يك اندازهگيري كمي تون سمپاتيك را فراهم كند.
مطالعات آزمايش تون سمپاتيك با استفاده EDA ،روي دامنه پاسخ استخراج شده به وسيله تحريك محرک متمركز شده است. پيكهاي بيرون كشيده شده در EDA به طور گسترده به تغييرات درونی فرد، تداخلات محيطي از قبيل دماي محيط، تفاوت در روشهاي ثبت و اثرات زماني خوگيري پاسخ با تحريكات اعمال شده حساس هستند. عمل بيوفيدبك ريلكسيشن مستلزم غلبه EDA بر تعداد زيادي از اين مسائل با فراهم كردن يك اندازهگيري كمي Objectiv است كه به طور گستردهاي مستقل از تفاوت در دامنه پاسخهاي evokad بيرون كشيده شده است.
آزمايشات تصويري فانكشتال بر نواحي خاصی از مغز در توليد و ارائه بازخورد تحريك خودكار دلالت دارد. اين نواحي شامل برخي نواحي مرتبط با تحريك و توجه از قبيل كمربند فوقاني، اينسولا، اوربيتو فرانتال كرتكس و لب جداري تحتاني است. همچنين مطالعاتي براي تخمين رابطه فعاليت مغزي به مدتيشين و هيپتوتيزم انجام شده است(Lazar 2000). كه در آنها فعاليت همراه با اين فرآيندها نمايانگر نقش محوري كمربندقدامی كرتكس است.
مطالعه كنوني تأثير اراده شناختي در سمپاتيك ريلكسيشن را تخمين ميزند. (مثلا كاهش انگيختگي سمپاتيك محيطي) سوژههاي سالم را در اجراي تمرينات بيوفيدبك ريلكسيشن آموزش داديم و از PET براي تخمين همبستگي كالبدشناسي اعصاب ،کاهش در EDA ،ارتباط فعاليت شناختي به اراده براي آرامش داشتن و اثر بیوفیدبك بر روي این فرآيند آرامش استفاده شده است ،و هدف از اين مطالعه شناخت مكانيسمهاي مغزي از طريق آن دسته پردازش كردن تغييرات در پاسخهاي آناتوميكي بدني است.
.1-2سوژهها
هشت داوطلب مرد راست دست ( با متوسط سن 41) بعداز گزينش پزشكي و رد اختلالات گزينشي با تجويز دارو كه ممكن است بر روي فعاليت مغزي تأثير بگذارد استخدام شدند. از سوژههاي زن جهت مطالعه استفاده نشده به خاطر محدوديتهاي مرتبط با (Adminstration of Radioactive Sabstance Adwisory Committee Licence).
قبل از مرور اجمالي سوژهها با تمرين بيوفيدبك ريلكسيشن آشنا شده و قادر به انجام وظيفه به صورت حرفهاي و قابل اعتماد را داشتند.
.1-3طرح آزمايشي
سوژهها سه بار تكرار چهار عمل در يك طرح آزمايشي فاكتوريل را انجام دادند. اين طرح فاكتوريل تخمين فعاليت نواحي مرتبط با اثر اصلي ريلكسيشن، اثر ناشي از دريافت فيدبك EDA و تقابل بين اين عوامل را ممكن ساخت، كه اجازه شناسايي نواحي كه فعاليت وابسته به ريلكسيشن به وسيله Biofeedbook را ميدهد. براي هر سوژه وظيفهها در يك دستورالعمل تصادفي ارائه شده بود. EDA (فعاليت الكتريكي پوست) به طور پيوسته و در تمام طول آزمايش نمايش داده شده بود.
سيگنالهاي بيوفيدبك ريلكسيشن خطي قرمز روي زمينه خاكستري روشن با cm12 ارتفاع و cm1 پهنا بود. آشكار شدن حرارت پنج بر روي صفحه نمايش علامتي به سوژهها براي شروع تمرين ويژه يا وظيفه مربوط بود.
با آرام شدن سوژهها ارتفاع حرارتسنج كم ميشود. تغيير در ارتفاع ستون حرارتسنج يك تابع لگاريتمي تغييرات در EDA سوژهها را ارائه ميكند همچنين ارتفاع ستون ميتواند بصورت تغيير تصادفي مرتب شود.
.1-4آموزش دادن در تمرين بيوفيدبك ريلكسيشن
به سوژهها انجام بيوفيدبك ريلكسيشن به صورت ماهرانه در طول روز قبل از مطالعه آموزش داده شده بود. سوژهها در مورد تكتيكهاي بيوفيدبك و آماده شده با اثبات بيوفيدبك ريلكسيشن آگاه بودند. براي يك دوره 5 دقيقهاي سوژهها نمايش ارتباط نوسان سطح تونسمپاتيك خود را مشاهده كردند. سپس آنها به كوشش جهت ریلکس کردن خود تشويق شدند و در این حالت مانیتورینگ فیدبک انجام می شد و در طول زمان 30 تا 45 دقيقه آنها مدوله كردن تونسمپاتيك خود را با استفاده از بيوفيدبك ياد گرفتند. فقط قبل از اسكن سوژهها تست شدند تا مطمئن شويم كه آنها قابليت باقي ماندن در تمرينات بيوفيدبك ريلكسيشن را دارند. در زمان اسكن، انجام كار بيوفيدبك ريلكسيشن به وسيله فيزيوتراپي آرام بين اسكنها و تشويقها و نورهاي مناسب براي انجام سريع و صحيح وظايف تسهيل شده بود.
.1-5عمليات آزمايشي
بيوفيدبك همراه با ريلكسيشن ارادي
سوژهها از طريق ريلكسيشن سعي ميكردند تا ستون حرارتسنج را به كاسه بازگردانند. معمولا سوژهها اين كار را در طي 2 تا 3 دقيقه انجام ميدادند.
1-5-1. بيوفيدبك بدون ريلكسيشن
سوژهها نيازمند تماشاي تصوير بدون ريلكسيشن بودند اما بايد سعي در جلوگيري از هرگونه انحراف به سمت پايين حرارتسنج به وسيله هيچگونه استراتژي كه مستلزم حركت بدن يا اعضا باشد ميكردند.
.1-5-2 بيوفيدبك تصادفي به همراه ريلكسيشن
سوژهها همان نمايش ويديويي حرارتسنجي كه تصادفي نوسان كرده است در محدوده بالاي ارتفاع ستون ديدند. در حال تماشا كردن صفحه نمايش لازم داشتند كه آرام شوند. اگر چه آنچه بر روي صفحه نمايش ظاهر شده بود ربطي به پاسخهاي فيزيولوژيكي سوژهها نداشت.
.1-5-3. بيوفيدبك تصادفي بدون تمرين ريلكسيشن
همانند عمل قبل سوژههامشغول به تماشاي يك صفحه نمايش ويديويي نوساندار، كه سطح برانگيختگي آنها را نشان نميداد بودند. در طول اين عمل آزمايشي به سوژهها گفته شده بود كه سعي در آرام كردن خود نداشته باشند. (به عنوان بيوفيدبك بدون ريلكسيشن)
.1-6نمايش EDA و بيوفيدبك
EDA منعكس كننده سطح هدايت پوست به طور پيوسته با الكترودهاي نقرهاي بسته شده به سطح كف دست چپ و انگشتان وسطي و سيگنال از طريق يك واحد پرداز نگرش كردنهاي تغذيه شده بود.
(SCL 200 ;Biofeedback Systems, Manchester, uk) خروجي آنالوگ فيلتر شده EDA به صورت Online نمايش داده شده و به صورت ديجيتالي روي يك PC و در MATLAB ذخيره ميشود.
(Math Warks Sherborn Mass, USA)- در MATLAB يك فيدبك براي هدف فراهم كردن صفحه نمايش ديداري به سوژه در زمان بيوفيدبك ايجاد شده بود. دادههاي EDA ناخالص (هر ms 100) به وسيله لگاريتم طبيعي و تغييرات زماني 9تبديل شده بود. در شروع عمليات بيوفيدبك سطح اين تابع به 1 نرماليزه شده بود و صفحه نمايش حرارتسنج ارتفاع تابع نرماليزه شده را نشان ميداد. (شكل 1)
شکل (1)
در آزمايشهايي كه در آنها هيچ بيوفيدبكي داده نشده بود. نمايگر حرارت سنج به وسيله توابع تصادفي حركت ميكرد. (مقدار جديد= + (5/0 مقدار قديمي) – مقدار قديمي).
.1-7تجزيه و آناليز اسكن PET
اسكنهاي به وسيله اسكنر Siemens XCPS ECAT EXACT HR+PET و در مد 3D با حساسيت بالا انجام شده است. سوژههاي مجموع از در از طريق يك كانوله (ماسوره) براي هر 12 اسكن و فعاليت دريافت كردند در طول زمان پنجره اندازهگيري شد در حاليكه سوژهها عمليات آزمايش را انجام ميدادند. تصاوير PET از وکسلهای (1وکسل =یک حجم سه بعدي كه با يك پيكسل معادل است) ( ) با طول محور 7/5 رزولوشن محور تشكيل شده است. به وسيله مسيردهي پارامترهاي استاتيکيSPM 99)) اجرا شده و در MATLAB آناليز شده بود. MRI هاي ساختاري از هر سوژه به داده PET پس از هر ساماندهي مجدد سريهاي زماني PET به داده PET ثبت شده بود. سپس تمام اسكنها به يك فضاي استريوتاكتيك منتقل شده بود.(Friston 1995, Talairach & Tournoux 1988 ).
داده بعد از تبديل به ساختار ماتريسي براي تجزیه به گروه داده براي شرايط و متغیرها آناليز شده بود. CBF كلي به صورت ماتريس به عنوان ANCOVA (تجزيه كوواريانس) به وسيله سوژهها داده شده بود و به عنوان يك كوواريانس متغير در آميختگي اعمال شده بود.
سرعت ريلكسيشن سمپاتيك براي هر اسكن ثبت شده بود. آناليزهاي ما ،از يك طراحي فاكتوريل در جستجوي اثر اصلي ريلكسيشن استفاده می كرد. بيوفيدبك تعامل ريلكسيشن×بيوفيدبك (جدول 1). اين روش اجازه شناسايي نواحي فعال مغزي مرتبط با ريلكسيشن (مستقل از فيدبك بصري)، فعاليت مربوط شده با بيوفيدبك EDA (مستقل از ريلكسيشن عمدي) و نواحي كه مربوط به بيوفیدبک و ريلكسيشن همزمان بودهاند را ميدهد. به علاوه روش فاكتوريل توان آماري بيشتري از اثرات ساده را در گزارش به عنوان استفاده از تمامي مجموع دادهها داشت، آناليز سرعت ريلكسيشن اندازهگيري شده، مستلزم تعيين نواحي مغزي مرتبط با تغييرات در تونهاسمپاتيك مشترك به عمليات ريلكسيشن و بدون ريلكسيشن بود. سرانجام ارتباط بين سرعتهاي ریلکسیشن اندازهگيري شده و فعاليت نواحي مغزي در آناليزهاي قبلي مشخص شده است.
روشهاي عمومي به كار رفته به وسيله نقشهبرداري پارامتري استاتيك به تفضيل به وسيله فريستون و دانشگاهها (فريستون و ديگران 1995) شرح داده شده است.
براساس مشاهداتي در مورد كنترل مغزي تابع آناتومي از جراحت، تحريك و مطالعات تصويري در انسان، ما پيشبيني ميكنيم كه فعاليت در نقاط مشخص از مغز وجود دارد كه با عمل تمرينات بيوفيدبك ريلكسيشن مرتبط است آسيبهاي كمربند قدامي نواحي، اوربيوفرانتال كرتكس، اينسولا، آميگدالا و لب جداری تحتاني به عنوان نواحي كه بر اندازههاي EDA اثر گذارند و موجب برانگيختگي آن ميشوند شناسايي شدهاند.( داماسیو و ديگران 1991،ترنل و داماسیو 1994 و به چارا و ديگران 1995) تحريك كمربند قدامي، اينسولا و آميگوالا لب تمپورال پزشكي پاسخهاي احشايي و قلبي و عروقي را مدوله كرد. (پول و رانسهوف 1949 ،اپنهایمر ودیگران1992) مطالعات تصويربرداري عملكردي ارتباطي بين كمربند قدامي، مداري، (Ventromedial Prefrontal) اينسولا و كرتكس پس سري آهيانهاي، آمیگدالا، پل مغزي و قطعه مياني مخچه مغزي با ميزان تحريك در اندازهگيريهاي EDA با اندازهگيريهاي قلبي و عروقي را گزارش كرده است.
ما تجربهها رابه صورت ابتدايي با P های كوچكتر از 001. كه به صورت تصحيح نشده هستند محدودهبندي كرديم. و متناوباٌ فعاليتها را در طبقاتي كه بيشتر از 10 وكسل بود، كه پيك فعاليت به صورت قابل مشخصي براي تمام مغز در P هاي كوچكتر از 0.5 تصحيح شده بود گزارش كرديم. به علاوه برای اجتناب از خطاهاي نوع دوم براي مناطق پيشبيني شده مقیاسی در نظر گرفته شد و از تقریبهای كمتر استفاده شد. (Worsly 1966) فعاليتهاي مناطق مغزي سابقا مربوط به كنترل خودكار بود. براي مثال كمربند قدامي يا اوربيوفرانتال، اينسولاو و كرتكس آهيانهايي تحتاني، آميگدالا و پل مغزي و قطعه مياني مخچه يا با همانندهاي مخالف نشان كه به مقدار قابل توجهي در P هاي كوچكتر از0.001 تصحيح نشده ميرسند پس از آن ما براي اعداد تصيح شده باا استفاده از حجمهاي فضايي كوچكتر از شعاعهاي mm10 كه با مركز مختصات به دست آمده از آزمايشهاي قديمي تصويربرداري عملكردي مستقل ،آزمايش كرديم.(Worsly 1966) بنابراين ما از مختصات x و y و z كه به صورت جلويي، جداري و عمودي در مقياس ميليمتر براي تصحيح مقادير كم استفاده كرديم.تصحیحها برای مقادیر کوچک:كمربند قدامي 38 , 20 , 16 ± (0 Kirchtly 200) ، كرتكس مياني پشتيباني 2 , 14,46 ±( Kritchly 2000)، كرتكس اوربیتوفرانتال و اينولاي پيشين -12 , 26 , 36± و اينسولا 14 , -6 , كرتكس تحتاني 4 و -36 و 42± آميگدالا -24 , 3 , 24± پل مغزي 42 , -30 ,16± و مخچه مياني 20- , -52 , 2 ±.از مختصات تالا رياچ (تالارياچ وتورنو 1788) و اطلس دوورنوی (دوورنوی 1991 ) به عنوان يكي از منابع براي مشخص كردن مكانهاي آناتوميكي اعصاب استفاده شد.
.1-8 عملكرد رفتاري و تشريح
در زمان تشریح سوژهها استفاده از دو روش اصلي ايجاد ريلكسيشن سمپاتيك را توضيح دادند كاهش تنشهاي لیمبيك و حركت در هر مورد يكي از ملزومات حين اسكن ميباشد. ايجاد نفسهاي آرامتر و نرمتر تصوير سازي صحنههاي خوشايند نيز همچنين توسط بعضي سوژهها به كار گرفته شده بود.
زماني كه ريلكسيشن به صورت مؤثر به دست آمده بود گزارشهاي سوژهها همراه با حالت خواب آلودگي و احساس خوشايندي بود.
عليرغم مقدماتی بودن دورههاي آموزش مناسب، ميزان تنوع و تفاوت بين سوژهها در زمان بيوفيدبك ريلكسيشن مورد توجه قرار گرفت. كه با درجهاي از هيجان اجرايي در زمان اسكن همراه بود. با اين حال در ميان گروه ريلكسيشن با بيوفيدبك یا بدون بيوفيدبك كاهشهايي را در EDA كه به صورت قابل توجهي در بين دو عمل توليد ميشود به ميزان ريلكسيشن سمپاتيك براي حذف كرد.
1-8-1. فعاليتهاي مغزي انجام عمليات (ريلكسيشن)
اثر اصلي ريلكسيشن بر روي مغز توسط مقايسه فعاليتهاي ريلكسيشن و غير ريلكسيشن (با و بدون بيوفيدبك) ارزيابي ميشود. افزايش فعاليت كه در مناطق خاصي از مغز مشاهده شده بود كه شامل: كمربند قدامي چپ (كه هر دو در تصحيح شده قابل توجهند. همراه با ريلكسيشن خود خواسته فعاليتهاي تشديد یافته مربوط به ريلكسيشن نيز همچنين در لب جداري تحتاني چپ مشاهده شده بود. (براي تصحيح شده براي مقادير كوچك) جدول 2 و تصوير 2. اثر اصلي بيوفيدبك (در مقايسه با نمايش تصادفي با تغييرات فيدبك حرارت سنج) هيچ منطقهايي از مغز را كه مقدار قابل توجه تصحيح شده برسد نشان نداد.
1-8-2 مدولاسيون ريلكسيشن به عنوان تابع فيدبك
با آزمايش كردن تقابل بين انجام بيوفيدبك و ريلكسيشن ما به دنبال پيدا كردن مناطقي از مغز بوديم كه فعاليتهاي مربوط به ريلكسيشن توسط بيوفيدبك مدوله ميشود. مقايسه بين فعاليتهاي در حين ريلكسيشن و غير ريلكسيشن در حضور و غياب بيوفيدبك بيان كننده فعاليت چشمگيري در مخچه مياني و كمربند قدامي دوگانه، كرتكس مياني پیشانی (براي تصحيح شده براي رقمهاي كوچك) بود.(جدول2وشکل 3).
شکل(3)
.1-9 فعاليت مربوط به سرعت اندازهگيري شده ريلكسيشن
ما بعدا فعاليت مغزي مربوط به سرعت متغير EDA در طول هر اسكن آزمايش کرديم. اين سرعتها به دو رگرسور ماتريسي طبق سرعت ريلكسيشن شكلدهي شد: (1) هنگامي كه سوژه سعي در كاهش تونسمپاتيك ميكند و (11) هنگامي كه سوژه فعالانه كوششي براي ريلكسيشن نميكرد. طی هم وظايف ريلكسيشن و هم غير ريلكسيشن و در هنگام انجام ريلكسيشن تنها فعاليت مرتبطي در EDA در همسايگي آميگدالاي راست مشاهده گرديد. (x و y و z مختصات 18 , 10 , 8-و 18 , 0 ,28- تصحيح شده براي حجم آميگدالا ) (جدول 3 و شكل 4)
.1-10 فعاليت مربوط به ريلكسيشن ارادي و موفق
در نهايت ما چگونگي فعاليت مرتبط با سرعتهاي اندازهگيري شده تغييرات در EDA را در نواحي كه بيانگر تغييرات عمده ريلكسيشن ارادي بودند آزمايش كرديم. همانطور كه در بالا بيان شده فعاليت در كمربند قدامي چپ و گلوبوس پالیدوس است كه مخصوصا بين عمل ريلكسيشن و غيرريلكسيشن به طور خاصي برجسته شده است.
ما فهميديم كه فعاليت در كمربند قدامي به صورت منفي با سرعت تغييرات EDA در طول عمليات ريلكسيشن مرتبط است. (پيرسون و ) اما نه در زمان عمليات غير ريلكسيشن (r=0/27 و كم اهميت). بنابراين فعاليت در كمربند قدامي اراده براي آرامش را نشان ميدهد و اين فعاليت هنگامي كه تونسمپاتيك كاهش داده نشده بود به مقدار ماكزيمم خود ميرسد. فعاليت در گلوبوس پالاديوس در مقايسه با كمربند قدامي رابطه مهمتري با سرعت تغييرات EDA در طول هر دو ريلكسيشن دارد. (منفي or=0/67 (P<0/00) و در مورد عمليات غير ريلكسيشن (مثبت r=0/9 و P<0/00) بنابراين فعاليت در گلوبوس پالیدوس در هنگام اراده كردن براي آزمايش افزايش مييابد.
و نيز هنگامي كه اين اراده در ريلكسيشن با غير ريلكسيشن محقق نميشود.
.1-11بررسی نتایج آزمایش
اگرچه ما دانش كمي درباره چگونگي شناخت فرآيندهاي مؤثر روي پاسخهاي جسمي داريم با وجود اين حقيقت آن است كه اينگونه تقابلها همگراي به يك تئوري قدرتمند احساس و عمل تصميمگيري است. (داماسیو و ديگران 1991- داماسيو 1996 بچارا و ديگران 1997) بررسيهاي قبل فعاليتهاي مغزي مرتبط با ارائه فيدبك حالات برانگيختگيهاي جسمي را توصيف كردهاند. (فرد ريكسون ديگران 1998- سوفر و ديگران 1998 ،کریتچلی و ديگران 2000) همچنين فعاليتهاي پديدار شده به وسيله تكنيكهاي ريلكسيشن- شناختي از قبيل مديتيشن و القاعات هیپنوتیسمی توصيف شده است. (رينويل و ديگران 1992 و لازار 2000) به هر حال اين تحقيق براي اولينبار به اين سؤال كه فعاليت مغزي مرتبط با سوژههايي كه به طور ارادي قصد در آرام نمودن خود با بيوفيدبك با بدون بيوفيدبك دارند چگونه است ميپردازد. ما فعاليت مغزي مرتبط با آرامش ارادي را در كمربند قدامي و قسمت مياني مخچه كه به طور مشخصي با بيوفيدبك در ريلكسيشن ارادي نمايان ميشد و فعاليت لبتمپورال مياني راست در همسايگي آميگدالا كه مرتبط با سرعت ثبت شده ريلكسيشن سمپاتيك در هنگام انجام تمامي وظايف بودند را مشاهده كرديم. اين يافتهها، شركت نواحي جداگانه زیادی را در كنترل حالات جسمي پيشنهاد ميكند[4].
شکل(4)
انجام كار ريلكسيشن بيشترين فعاليت را در نواحي كمربند قدامي چپ فراخواني ميكند. اين نواحي حاشيهاي كرتكس در فرآيند حسي و شناختي و بخشي از يك سيستم توجهي مياني كه لبهاي كرتكس آميانهاي و پری فرانتال را در دوسمت در برميگيرند، اثبات شدهاند. (نوبرو ديگران 1997 مسلم1999)
اگرچه ريلكسيشن داراي بخش كوچكي از تمركز توجهي به پاسخهاي بدني است (مثلا تنفس) با اين حال غير مختل است كه مدولاسيون تفسير واحدی براي فعاليت كمربند فراهم كند. آسيب به كرتكس كمربند قدامي ميتواند توجه یکپارچه را محدود كند. اما سازش خودكار، پاسخي شامل پاسخهاي سمپاتيك پوست را به وجود می آورد. (ترنسل و داماسیو 1994). افزايش فعاليت كمربند قدامي ميتواند ناشي از تحريكات خودكار قبلي باشد (مثلا كارهايي كه فشار خون را افزايش ميدهند) .(کریتچلی و ديگران 2000)
تحقيقات تصويربرداري عصبي نه فقط رابطه اين بين كمربند قدامي و پاسخهاي خودكار بلكه همچنين جوانب اين رابطه را نيز پيشنهاد ميكند، ما به طور برجسته فعاليت كمربند چپ را در رابطه با آرامش ارادي مشاهده كرديم، كه در تقابل با فعاليت كمربند راست مشاهده شده ،در طول حالات القايي تحريك سمپاتيك است. ما همچنين قادر به شرح فعاليت كمربند قدامي چپ در رابطه با ميزان اندازهگيري شده ريلكسيشن سمپاتيك انجام شده در طول اسكن بوديم. به طور يكسان هم براي اراده ريلكسيشن و هم مدولاسيون با فيدبك فعاليت كمربندي قدامي چپ به طور مشخصي بين حالتي كه كار ريلكسيشن انجام ميشود و زماني كه انجام نميشود متفاوت بود، و هنگامي كه ريلكسيشن انجام شده بود كاهش مييافت.
بنابراين شواهد ما پيشنهاد ميكند كه، كمربند قدامي چپ در مدولاسيون ارادي حالات بدني تحريكي همسان با يك نقش رفتاري اجرايي درگير است و خودش مدوله شده به وسيله فيدبك آوران از جوانب مربوط به تأثير روي پاسخ بدني اين ارادهها است. (کریتچلی 2001)
به علاوه كرتكس كمربند قدامي، افزايش فعاليت در گلوبوس پالاديوس و لب آهيانهاي تحتاني نيز در ارتباط با عمل ارادي آرامش هستند. اگرچه الزاما عمل رفتاري ريلكسيشن كاهش در فعاليت موتوری را در بردارد، با این وجود بودن تنها يك تفسير براي افزايش مشاهده شده در فعاليت پالیدال غير محتمل است. فعاليت گلوبوس پالاديوس در انجام ريلكسيشن و غير ريلكسيشن فرق ميكند، اما همچنين با نفوذ اراده به طور مستقل مدوله شده بود. بنابراين آناليزهاي همبستگي افزايش قابل توجهي در فعاليت پالاديال با كاهش در تونسمپاتيك ،هنگامي كه سوژهها ارادهاي در جهت آرام شدن نميكردند و هنگامي كه سوژهها قادر به ريلكس شدن در طول عمل ريلكسيشن نميشدند، را نشان داده است.
اين تابع شناسايي خطا با شواهد فيزيولوژيكي عصبي دليل فعاليت نوار بلند در خطاهاي سيگناليك در خروجيهاي پيشبيني شده همسان است. اگرچه كمربند قدامي و كرتكس اوربيتوفرانتال نيز در شناسايي عدم مطابقت بين اراده (يا اميد) با فيدبك آوران ممكن است كمك كنند.
شركت لب آهيانه تحتاني چپ به شناخت اراده، هنگام انجام دادن ريلكسيشن سمپاتيك به عنوان فعاليت مضاعف در لب آهيانهاي تحتاني راست ،دلالت در جهت توجه به تحريك خارجي داشته است. يافتههاي پيشين ما يك زير لايه عصبي مشترك براي تحريك و توجه انتخابي در لب آهيانهاي راست را پيشنهاد ميكند. (کریتچلی 2000) در اين جا، يافتههاي ارائه شده فعاليت آهيانهاي را با شناخت مدولاسيون مشتق از تونسمپاتيك ،كه با فعاليت مضاعف در لب آهيانهاي چپ و تحريك سمپاتيك با فعاليت در لب آهيانهاي تحتاني راست همراه است را، پيشنهاد ميكند. بنابراين يك تعبير از اين يافتهها اين است كه فعاليت در لب آهيانهاي تحتاني چپ مربوط به توجه به حالات داخلي و نه تحريك خارجي است.
همچنين فعاليتهاي مرتبط با بيوفيدبك ريلكسيشن به نواحي مغزي هم جهتي بيشتري را مخصوصا در نواحي كمربند قدامي كرتكس و مخچه مياني ميدهد. اين نواحي قبلا دلالت بر تحريكات قلبي عروقي داشتند. مستقل از چگونگي تحريكات ايجاد شده، مشاهداتي كه بر اين ناحيه در يكپارچگي پاسخهاي بدني با اراده شناختي دلالت دارد،به طور شگفتآوري ما مشاهده كرديم كه، ناحيه بزرگتري در فعاليت كمربندي راست نسبت به چپ با بيوفيدبك ريلكسيشن مرتبط است. ما رابطهاي بين فعاليت لب آهيانهاي مياني راست، جلو و زير آميگدالا و ميزان ريلكسيشن خودكار پيدا كرديم. فعاليت در ناحيه آميگدالا شديدا با پاسخهاي خودكار مرتبط است. (تحريك سمپاتيك كه معمولا حالات احساسي را از قبيل ترس و تهديد كردن را همراه دارند.) (ريس و ليدوك 1987 ،نورمارک 1997 و بوچل 1998) .تحقيق كنوني فعاليت لب آهيانهاي مياني در همسايگي آميگدالا را كه منعكس كننده ريلكسيشن تونسمپاتيك مستقل از اراده براي آرامش است را مشخص ميكند. روشهاي ما به ما اجازه اين كه آيا اين فعاليت نمايانگر كنترل وابران تونسمپاتيك است يا منعكس كننده نماد آوران ريلكسيشن بدنی است را نميدهد. (شايد ارتباط آميگوالا با هسته ساقه مغز)
همانطور که نتایج این آزمایش نشان می دهد نواحی که در EDA دخیل هستند و نواحی که در بیو فیدبک ریلکسیشن فعال می شوند تا حد زیادی با یکدیگر متفاوتند.نواحی مرتبط با EDA را سینگولت قدامی ، اوربیتو فرانتال کرتکس ، اینسولا ، آمیگدالا ، لب آهیانه ای تحتانی، پل مغزی و مخچه میانی(بر طبق نتایج آزمایشات) می دانیم .این نواحی در کنار هم پاسخ به تحریکات سمپاتیک را می سازند.اما نقاطی که با بیو فیدبک ریلکسیشن مرتبطند عبارتند از: سینگولت چپ و راست ،لب آهیانه ای تحتانی ، مخچه میانی ، گلوبوس پالیدوس و کرتکس میانی پیشانی. همانطور که دیده می شود مرز اشتراک بین این دو بسیار ناچیز است .(یعنی مخچه میانی و لب آهیانه ایی تحتانی).و این مطلب را گواهی بر این مطلب می گیریم که در حقیقت این تغییر وزنها در مغز است که موجب بهبود در فرایند بیو فیدبک می شود.با استناد به این مطالب و اینکه مدلسازی های مغزی نقاط اشتراک فراوانی دارند ما با استفاده از مدلهای سیستمهای عصبی عضلانی به مدل سازی بیو فیدبک می پردازیم. همانطور که دیده میشود بر طبق نتایج این آزمایش سه جزء اصلی در یک سیستم عصبی عضلانی در این فرایند ها دخیل هستند(کرتکس،باسال کانگلیا و مخچه). در حقیقت این نقاط اشتراک بسیار هستند که ما را بسمت استفاده از این مدلها برای مدلسازی بیو فیدبک سوق می دهد. البته مسلما تمامی مدلها در اینجا قابل استفاده نیستند و در اینجا نیز از مدلهای مشترک برای این منظور استفاده خواهد شد.
بخش دوم
.2-1 روش کار
بیو فیدبک تکنیک بدست آوردن توانایی خود تنظیمی یک تابع بیو لوژیکی است. که معمولا بطور طبیعی ناخود آگاهانه از طریق یک سری کمکهای آموزشی که بو سیله مسیر فیدبک خارجی اضافه می شود است.ما یک مدل ریاضی برای بیو فید بک پیشنهاد می کنیم که در آن سیستم یاد گیری در سطح هوشیاری مشخصات یک سیستم تنظیم نیمه هشیارانه را مطابق با تابع بیو لوژیکی فرا می گیرد.هنگامیکه یاد گیری همگرا می شود سیستم یاد گیر خودش یک سیستم معکوس از سیستم تنظیم میشود.سپس اگر یک فرمان تنظیم به سیستم یادگیر در سطح هشیاری داده شود این فرمان سیستم تنظیم را بسمت پیروی اکید از فرمان بدون نیاز به مسیر فید بک خارجی پیش خواهد برد.که کنترل اختیاری تابع بیولوژیکی را ممکن می سازد.[3]البته همانطور پیش تر نیز ذکر شد هدف اصلی کنترل تابع بیولوژیکی بصورت صرف نمی باشد در حقیقت هدف ، تغییر State مغز بگونه ایی است که بتوان تابع بیو لوژیکی را بهبود بخشید زیرا ما تقریبا در اکثر موارد دسترسی مستقیم به این تابع نداریم و حتی می توان گفت که برای کنترل یک بخش از بدن نیز نمی توان یک قسمت خواص از مغز را نام برد.پس تعریف ما از هدف ، تغییر وزنهای شبکه عصبی است به گونه ایی که بتوان بهبود عملکرد تابع بیولوژیکی را مشاهده کرد، خواهد بود.
بیوفیدبک را برای کاربرد های مختلفی می توان انجام داد که یکی از آنها جهت توانبخشی است .در این نوع بیو فیدبک جدا از سیستم شناخت سیستمهای مرتبط با سیستمهای عصبی عضلانی نیز برای انجام یک عمل در گیر هستند لذا با توجه به این مطلب که در این مورد بخش مهمی از مدل بیو فیدبک مربوط و همانند سیستمهای عصبی عضلانی می شود ، ما از این مدلها برای پیشبرد کار خود استفاده می نماییم.
ابتدا مدل کلی بیو فیدبک را که توسط آن یک سوژه عملی را فرا می گیرد(در بیوفیدبک ما با نوعی از یادگیری روبرو هستیم)ذکر می کنیم که این مدل می تواند در مورد یادگیری بسیاری از اعمال عادی و روزمره هم کاربرد داشته باشد.سپس با توجه به نتایج بدست آمده از آزمایشات fMRI که در بخش قبلی ذکر شده است و نقاطی را که در فرایند بیوفیدبک تاثیر گذارند برای ما مشخص می کند به مدل کردن این نقاط می پردازیم.
ما در اینجا 4 نقطه از مغز را که بیشتر با بحث بیو فیدبک متبط هستند مدل می کنیم .این 4 بخش عبارتند از :قشر مغز، باسال گانگلیا ،آمیگدالا و مخچه.هرکدام از این 4 بخش به نحوی در فرایند بیو فیدبک موثر هستند و از این جهت این ها را برای مدلسازی انتخاب کرده ایم که در تصویر برداریهای fMRI این 4 بخش فعالیت عمده ایی از خود نشان داده و گمان بر اینست که این نقاط ارتباط بیشتری با فرایند بیوفیدبک دارند.سپس با توجه به مدل یادگیری تقویت شده (Reinforcment Learning) که مدل کلی ما را تشکیل می دهد جای هر کدام از این بخشها ذکر میشود.و ارتباط این نقاط با یکدیگر تبیین می شود.
2-2. مدل بیوفیدبک پیش از رسیدن به مهارت
2-2-1 . مدل کلی بیو فیدبک(Reinforcment Learning)
در بیوفیدبک هماند بسیاری از فرایند های دیگری که در مغز شکل می گیرد اولین مرحله یادگیری و شناخت است .که در این مرحله یک فرد با توجه به فیدبکهایی که به وی داده می شود و همینطور آموزشهایی که یاد داده می شود یا خود فرد بر اساس الگوی پاداش و تنبیه یاد می گیرد سعی در کنترل یک تابع بیولوژیکی یا همان خود تنظیمی می نماید .مدل این مرحله می تواند مشترک با مدلهای یادگیری در سیستمهای عصبی عضلانی باشد .
همانطور که می دانیم در یک سیستم عصبی عضلانی عوامل مهم و تاثیر گذار در فرایند کنترل عبارتند از :مخچه ، کرتکس و باسال گانگلیا و ارتباط این سه بخش از مغز که فرامین حرکتی را می سازد[5].البته در بیو فیدبک مجموعه ایی از عوامل هستند که می توانند عامل بهبود باشند .با توجه به اینکه ما در بیو فیدبک به وزن دار شدن شبکه عصبی معتقد هستیم لذا حتما اینگونه توقع نداریم که تابع کنترل اصلی را اصلاح کنیم هرچند که در پاره ایی موارد می تواند این اتفاق بیفتد. ولی آنچه که مهم است وزن دار شدن شبکه در جهت بهبود است.و در مرحله اول یادگیری در جهت وزن دار کردن این شبکه است.
در اینجا مدل یادگیری تقویت شده را بعنوان پایه ایی برای کار خود قرار دهیم.یعنی مدلی همانند شکل (5) . همانطور که در شکل دیده می شود عملگر وضعیت x را مشاهده می کند که در این وضعیت می تواند توسط دستگاههای مانیتورینگی که برای فیدبک کردن یک حالت خاص (مثل EEG یا ECG و یا هر مشخصه دیگری که از سیگنالهای حیاتی فرد مورد نظر استخراج شده اند)بکار می روند به فرد فیدبک شود. وظیفه در اینجا بعنوان فعالیت u مطابق با خط مشی u=g(x) است.(یا در حالت اتفاقی آن P(u|x) ) که در ازای آن پاداش r در یافت خواهد شد .[5]
شکل(5)
هدف از یادگیری پیدا کردن مسیری است که میزان پاداشهای جمع آوری شده در طولانی مدت را ماکزیمم کند.یک فعالیت می بایست به گونه ایی انتخاب شود که هم پاداش لحظه ایی را بگیرد و هم پاداشهایی را که در آینده مطابق با دینامیک محیط داده می شود به خوبی جمع آوری کند. به این ترتیب عملگر یک تابع ارزشی V(X) را فرا می گیرد که پاداشهای آنی را نیز در بر دارد.تفاوت بین پاداش پیش بینی شده و پاداش حقیقی را بصورت TD (Temporal Difference) δ را که هم برای یادگیری تابع ارزشی V(x)و هم برای بهتر کردن خط مشی g(x) مورد استفاده قرار می گیرد را نیز تعریف می کنیم.[5]
برای ماکزیمم کردن کردن مجموع پاداشهای آتی با استفاده از رابطه زیر داریم:
که 0<δ<1 ضریب کاهش برای پاداشهای آتی است.استراتژی پایه اینست که در ابتدا امید ریاضی معادله بالا برای هر حالت شروع x بعنوان تابع ارزشی ، وضعیت V(x) را یاد می گیرد و سپس برای بهتر کردن خط مشی در بازگشت به تابع ارزشی است.برای یک خط مشی داده شده توابع ارزشی حالات گذرا می بایست در معادله زیر صدق کند.
که r(t) و X(t+1) دینامیکهای محیطی بوده و مستقل از فعالیت U(t) هستند.با توجه به این محدودیت معیاری را که برای یادگیری تابع ارزشی تعریف می کنیم بصورت زیر است:
δ(t)=r(t)+γV(x(t+1))-V(x(t))
که انحراف از متوسط آن باید به صفر برسد. و این را خطای TD تعریف می کنیم .زیرا این معادله از مشتق از تفاضل پاداشهای آتی پیش گویی شده تشکیل شده است.پس تابع ارزشی را بصورت زیر می توان نوشت:
که α نرخ یادگیری است.
چندین روش برای بهبود روش (خط مشی) بر اساس پاداشهای پیش بینی شده وجود دارد که مشهور ترین آنها رابطه زیر بر اساس تابع ارزش فعالیت است.
این رابطه تخمینی از اینکه چه مقدار پاداش می بایست توسط توسط فعالیت U بدست آید و متعاقب آن از روش جاری پیروی شود را بدست می دهد.که در اینصورت تابع ارزش فعالیت بصورت زیر تبدیل می شود:
پس روش پیدا کردن فعالیت باخصلت زیاده خواهی بیشتر است:
(5)
بنابراین در الگوی یادگیری TD ، خطای TD (δ) نقش دوگانه ایی را ایفا می کند.هم سیگنال آموزش برای پیش بینی پاداش (V ) و هم برای انتخاب فعالیت(Q).البته از TD بیشتر برای کنترل و بهینه سازی مسائلی از قبیل سیستمهای ناوبری رباتها استفاده می شود.[5]
البته در سال 1990 آشکار شد که الگوریتمهای یادگیری تقویت شده تطابق خوبی با الگوی برنامه ریزی دینامیک دارد که به آنالیزهای تئوری الگوریتمهای یادگیری کمک شایانی میکند.[6]
در حالتی که ما پیوستگی زمانی داشته باشیم می توانیم روابط را بصورت زیر برای تابع ارزش بنویسیم:
که τ ثابت زمانی پیش بینی پاداش است.با توجه به این رابطه خطای TD بصورت زیر تعریف می شود:
که برای بروز رسانی تابع ارزش و خط مشی مورد استفاده قرار می گیرد.مزیت نوشتن فرمول بصورت پیوسته اینست که می توانیم از گرادیان تابع ارزش برای طراحی بهتر خط مشی استفاده کنیم.روابط مربوط به دینامیکهای محیطی و پاداش بصورت زیر نوشته می شوند:
سپس شرط بهینگی تابع ارزش بوسیله معادله Hamilton-Jacobi-Bellman(HJB) داده می شود.[7]
اگر دینامیکf(x,u) با در نظر گرفتن ورودی u خطی باشد و پاداش نیز مانند زیر بصورت محدب باشد:
آنگاه فعالیتی که سمت راست معادله HJB را ماکزیمم می کند عبارتست از:
اگر تابع ارزش V در معادله HJB صدق کند آنگاه یک روش کنترل فیدبک بهینه را بدست می دهد.حتی اگر تابع ارزش بهینه نامشخص باشد باز هم می توانیم از این رابطه با در نظر گرفتن تخمین جاری تابع ارزش استفاده نمود.
.2-2-2 مدل کرتکس
کرتکس عملکردهای متفاوتی را با مدارهای یکسانی انجام میدهد.اما هر منطقه یک ورودی و خروجی بخصوصی را دارد.مثلا اگر منطقه بینایی ورودی بینایی دارد ، بناچار خروجی بینایی نیز خواهد داشت.بنابراین منطقه بینایی مدارهای بینایی و منطقه شنوایی مدارهای شنوایی ندارد، بلکه همه یک نوع بخش دارند و فقط ورودی و خروجی آنها متفاوت است[8].
در یک تقسیم بندی کلی می توان کرتکس را به بخش تقسیم نمود:قسمت جلویی و پیشانی که در ارتباط با عمل و پاسخ است ، بخش عقب که عملکرد حسی و ادراکی دارد.کرتکس اطلاعات حسی را بوسیله سیستم فرا فکنی حسی بدست می آورد[8].
با توجه به موارد گفته شده در بالا کرتکس بخشی است که ورودیها را در یافت می کند و پس از تبدیل آن به صورتهای قابل شناخت برای دیگر قسمتها(به همان صورت) آنها را به بخش مربوطه می فرستد.پس می توانیم برای کرتکس یک مدل ساده همانند شکل(6) در نظر بگیریم[6].
شکل(6)
که تابع تبدیل این بخش را با توجه به اینکه تغییری در نوع اطلاعات ورودی داده نمی شود می توانیم یک تابع تبدیل خطی و متغیر با زمان در نظر بگیریم.
3-2-2. مدل باسال گانگلیا
باسال گانگلیا از بخشهای زیر تشکیل شده است:هسته کودت ، پوتامین، گلوبوس پالیدوس و آمیگدالا.که بخشی از سیستم لیمبیک می باشد.سیستم لیمبیک در وسط مغز و بصورت یک ساختار مرتبط به هم و حلقه مانند ، دور بخش مرکزی مغز قرار گرفته است .در حقیقت سیستم لیمبیک از قسمتهای زیر تشکیل شده است:برجستگی سینگولت،برجستگی پاراهیپو کامپال ،آمیگدال ، هیپو کامپ،ناحیه سپتال ،هسته آکوم بنز و هسته بزالیس[8].
تحریک الکتریکی ناحیه لیمبیک باعث ایجاد پاسخهای احشایی مانند تغییرات در فشار خون ،بلع و تنفس می گردد.علاوه بر این سیستم لیمبیک با هیپو تالاموس که پیامهای زیادی از احشای درونی بوسیله NTS دریافت می کند ارتباط دارد. با این توصیف سیستم لیمبیک نیز باید عملکردی مانند هیپو تالاموس داشته باشد.یعنی پاسخهای انگیزشی و هیجانی ایجاد کند[8].
شکل(7)
هیپوکامپ و آمیگدال در حافظه نقش مهمی بر عهده دارند.به نظر می رسد آمیگدال خصوصا در مواردی که در ارتباط با گرایش یا اجتناب از محرکهاست نقش دارد.تحریک الکتریکی آمیگدال در حیوانات پاسخهای هیجانی مانند ترس، خشم همراه با احساسات احشایی را بوجود می آورد[8].
برجستگی سینگولت و برجستگی پاراهیپو کامپ اطلاعات تنی ، حسی ، بینایی و شنوایی را از مناطق زیادی از کرتکس دریافت می کنند و آن را به هیپوکامپ می دهندیعنی این اطلاعات را به جایی می دهند که احتمالا خاطرات وقایع در آنجا ساخته می شوند[8].
در نتایج بدست آمده از آزمایشاتfMRI مشاهده شد که ما سینگولت چپ و راست و گلوبوس پالیدوس را به عنوان نقاطی با فعالیت بیشتر داریم.در حقیقت این نقاط بخشهایی از باسال گانگلیا هستند که فعالیتش افزایش یافته است.با توجه به این مطلب برای این قسمت نیز از مدلهای باسال گانگلیا استفاده می کنیم.همانطور که می دانیم با توجه به وجود نقاط یاد گیر مغز در این ناحیه مدلهایی که برای باسال گانگلیا ذکر می شوند می بایست قابلیت یادگیری داشته باشند.در حقیقت بخش اصلی مدل Reinforcment Learning در این بخش قرار دارد.برای این بخش مدلی همانند شکل زیر در نظر می گیریم
شکل(8)
این بخش شامل سیگنال ورودی ، سیگنال خروجی و سیگنال پاداش است.سیگنال ورودی این مرحله ورودی از مرحله قبل است(از قشر مخ).سیگنال پاداش برای آموزش تابع تبدیل بکار می رودکه همان نوروترانسمیتر دوپامین است که از نورونهای دوپامین ترشح می شود.مدلی که در این قسمت استفاده می شود مدل یادگیری TD (TD Learning Model) باسال گانگلیا است.
یافته های اخیر نشان می دهد که پاسخ نورونهای دوپامین در دوره یادگیری بسیار مشابه با یادگیری TD است.هدف اصلی نورونهای دوپامین باسال گانگلیا است که بین ساقه مغز و قشر مخ قرار دارد.بخش ورودی باسال گانگلیا ، استریاتوم است که ورودی دوپامینرژیک را از بخش به هم فشرده جسم سیاه دریافت می کند.
استریاتوم از دو بخش تشکیل شده است استریو سوم و ماتریس.که استریوسوم بخش ورودی است و به نورونهای دوپامینرژیک در SNc مرتبط می شود.وماتریس به بخش شبکه ایی جسم سیاه(SNr) و گلوبوس پالیدوس GP))مرتبط می شود.که خروجی آن به ساقه مغز و طریق تالاموس به قشر مخ می رود.که این دو بخش ساختار شکلی یادگیری TD را به یاد ما می آورد.که یکی برای پیش بینی پاداش و دیگری برای انتخاب فعالیت است.
مدار باسال گانگلیا می تواند یادگیری TD را بصورت زیر انجام دهد (شکل 9).
شکل (9)
وضعیت محیط و سابقه و مفهوم یک وظیفه در قشر مخ بازنمایی می شود و با X نشان داده میشود.تابه ارزش حالت V(x) در استریوسوم آموزش دیده است.در حالیکه تابع ارزش Q(x,u) در ماتریس آموزش دیده است[5].یکی از گزینه های مناسب برای انتخاب فعالیت u که در خروجی مسیر باسال گانگلیا قرار دارد بوسیله رقابت در ارزش فعالیتها طبق رابطه (5) گزینش می شود.بر اساس نتیجه سیگنال پاداش r و تابع ارزش وضعیت جدید، خطای TD (δ) برای شروع آتش نورونهای دوپامین در جسم سیاه ، فرستاده می شود.که خروجی آنها به استریاتوم باز خورد می شود و بعنوان سیگنال یادگیری هم برای تابع ارزش حالت V(x) و هم تابع ارزش فعالیت Q(x,u) در استریاتوم مورد استفاده قرار می گیرد.البته باید توجه کرد که موارد مبهمی نیز در مدل یادگیر ی TD باسال کانگلیا وجود دارد .مثلا اینکه تفاوت گذرای تابع ارزش V در مدار مرتبط با استریاتوم چگونه محاسبه می شود.
.2-2-4 مدل آمیگدال
د راینجا ما به مدلسازی آمیگدال می پردازیم.دلیل اینکه چرا ما در این بخش این کار را انجام میدهیم هم به این علت است که در تصویر برداریهای fMRI فعالیتهایی در اطراف آن مشاهده شده است و هم اینکه همانطور که در بخش قبل گفته شد ما در انتخاب وضعیتV(x) و انتخاب فعالیت Q(x,u)بحث رقابت را داریم.انتخاب یک فعالیت یا یک وضعیت بسته به میزان ارزش آن است که طبق رابطه (5) انجام میشود.در اینجا ما برای آمیگدال نقش ارزش گذاری فعالیت یا وضعیت را قائل هستیم لذا با توجه به ارتباط آن با سایر قسمتها برای آن مدلی ارائه می دهیم.
اخيراً بيان شده که وابستگي بين محرک و اثرات احساسي آن در مغز در قسمت آميگدالا رخ مي دهد. در اين ناحيه به طور گسترده اي به آناليز محرکهاي رسيده به قشر حسي مغز و همچنين تالاموس و تعيين ارزش احساسي هريک پرداخته مي شود. شواهد موجود بر اين باور است که پردازش صورت گرفته به صورت يادگيري شرطي مي باشد[10].
نتايج اين يادگيري به قسمتهاي ديگر مغز مانند هيپوتالاموس که واکنش هاي احساسي را ايجاد مي کند فرستاده مي شود. نقش آميگدالا نسبت دهي ارزش احساسي هريک از محرک ها بر اساس تقويت کننده (reinforcer) اوليه است[10].
همانطور که در شکل(10) ديده مي شود چندين قسمت ديگر مغز نيز در اين رابطه با آميگدالا در ارتباط هستند. مخصوصاً تالاموس، هيپوکامپ و قشر orbitofrontal که به عنوان ورودي و خروجي به آميگدالا عمل مي کنند.
شکل(10)
آميگدالا با وجود اندازه کوچک خود، داراي ساختار پيچيده اي مي باشد و لايه هاي متعددي از اتصالات را با ساير قسمتها دارد:
- داده هاي خود را از قسمتهاي حسي قشر مغز دريافت مي کند.
- خروجي خود را به وسيله اتصالات متعدد به هيپوکامپ، هيپوتالاموس، OFC مي دهد.
- در نتيجه کلاً سيستم به صورت توليد کننده punishment و reward عمل مي کند. آنچه که آميگدالا را مهم مي کند، قابليت آن در پيوند بين تحريکات احساسي و محرک هاي خنثي است. بطوريکه اگر يک تحريک خنثي در نزديکي يک تحريک احساسي رخ دهد، اين تحريک مي تواند به توليد واکنشهاي مشابه بپردازد. (يادگيري شرطي)[10]
با توجه به موارد گفته شده می توان اینگونه برداشت کرد که آمیگدال مسئولیت تولید سیگنال پاداش را با توجه به ورودیهای خود دارد(سیگنال پاداش درشکل 8).در حقیقت می توان اینگونه گفت که آمیگدال ارتباط مسقیم با آتش کردن نورونهای دوپامین دارد و به نوعی علت اصلی تولید دوپامین در این سلولها است. همانطور که در بخشهای قبلی نیز گفته شد ورودی این بخش به خروجی بخش قبلی (قشر مخ) متصل است.
در مورد مدلهای محاسباتی که برای آمیگدال ارائه شده اند ما به ذکر یکی از آنها بر اساس مرجع شماره[10]و[11] اکتفا می کنیم.
در اینجاارتباطات بين تالاموس و قشر حسي مغز را با آميگدالا به عنوان محرک ها در نظر گرفته ايم و با S نمايش مي دهيم. در آميگدالا بازاي هر محرک يک گره A وجود دارد. براي کليه خروجي هاي مدل نيز يک گره خروجي وجود دارد که E ناميده مي شود. اين گره به طور ساده اي خروجي گره هاي موجود در OFC را از خروجي گره هاي آميگدالا کم مي کند. براي هر گره A يک ضريب پلاستيسيته V وجود دارد و روابط در آميگدالا به شرح زير است:
ضرايب V به نسبت اختلاف موجود بين تقويت کننده و فعال سازي گره هاي A تنظيم مي شود. پارامتر پارامتر نرخ يادگيري است که بين 0 و 1 مي باشد:
سيگنال پاداش (reward) از قسمتهاي مختلف مي تواند سرچشمه مي گيرد مانند تالاموس، هيپو تالاموس يا عقده هاي قاعده اي که در اين مدل تمام منابع در يک ورودي R خلاصه شده است.
در اینجا برای مدل تنها یک خروجی در نظر گرفته می شود که البته فرض درستی نیست.(شکل 11)
شکل(11)
مدلی که در بالا برای آمیگدال ذکر شده است دارای معایب زیادی است ولی این مزیت را هم دارد که به دلیل سادگی می تواند بسیار پر کاربرد باشد.
.2-2-5 مدل مخچه
مطالعات تصویری مغز نشان می دهد که برخی از بخشهای مخچه و نواحی قشری مغز که ورودیهایی از مخچه در یافت می کند در هنگام تصور حرکت نیز، فعالیت دارند[12].
در مطالعات fMRI انجام شده بر روی سوژه هایی که فعالیت بیو فیدبک را انجام میداده اند نیز این فعالیت نیز مشاهده شده است[4].با توجه به نتایج بدست آمده می توان اینگونه استنباط کرد که سوژه ها در هنگام انجام بیوفیدبک ریلکسیشن از تصاویر ذهنی کمک می گرفته اند که مربوط به حرکت بوده است و این موجب فعال شدن مخچه و ظاهر شدن آن در تصاویر شده است.
البته ناحیه پل ساقه مغز قسمت پشت پلها و قسمت شکمی مخچه شامل مدارهایی می گردد که در حرکت بدن در فضا (قدم زدن ، دویدن، شنا کردن و غیره ) و در کنترل کردن ماهیچه های چشم و تشخیص جهت صدا مهم هستند.همچنین تمام ناحیه به مقدار زیادی در خواب و رویا نقش دارد[8]. این مطلب می رساند که فعالیت مخچه فقط منوط به انجام عمل حرکتی یا تصور آن نمی باشد بلکه هر تصویر ذهنی که به نوعی با سوژه در ارتباط باشد می تواند موجب فعالیت آن گردد.
اما سئوال اینست که وظیفه مخچه چیست.وظیفه ایی را که محققین برای مخچه متصور هستند ایجاد مدل داخلی بدن و محیط و ذخیره آنهااست.که چندین دلیل و مدرک برای این اینکه مخچه برای این کار مورد استفاده قرار می گیرد وجود دارد.اول اینکه آسیب به مخچه اغلب منجر به مشکل حرکتی مخصوصا در حرکات بالیستیک و سریع می شود.و دوم اینکه آناتومی و فیزیولوژی مخچه بگونه ایی است که برای یاد گیری مدلهای داخلی بسیار مناسب است.
در این بخش ما به ارائه مدلهای مربوط به مخچه می پردازیم و نحوه مدلسازی آن را ارائه می کنیم.با توجه به داده های آناتومیکی و فیزیولوژیکی مدل یادگیری زیر برای مخچه پیشنهاد می شود.موضوعی که می بایست مدل شود، مثلا دینامیک یا سینماتیک حرکت دست نگاشت هدف را تعیین می کندX→Y . بعنوان مثال X دستور موتوری وY نتیجه سنسوری است.سیگنال ورودی X بصورت یک ورودی فیبر خزه ایی است که در طبقه میانی آن را با bj(X(t)) نمایش می دهیم(تبدیل شده آن در سلولهای گرانول).سپس خروجی سلول پورکینیه بوسیله مجموع سلولهای گرانول bj(X(t)) در وزنهای سیناپسی ωi ضرب می شود مثلا:
الگوریتم یادگیری این وزنها را بوسیله تولید خطای خزوجی و ورودی به روز رسانی می کند.
کهα سرعت یادگیری است. این یادگیری می تواند توسط پلاستسیته سیناپسی سلول پورکینیه در صورتیکه سیگنال خطای مناسب y^(t)-y(t) فراهم شود، انجام گیرد.
شکل 12 شماتیک ارتباطات مخچه با سایر نقاط مغز را نشان میدهد.
شکل (12)
در این بخش ما از مدل آقای Kawato برای مدل کردن مخچه استفاده می کنیم.که شمایی از مدل یادگیری فیدبک-خطا در شکل (13) دیده می شود.ما نیز از این مدل برای مدلسازی این قسمت از مغز استفاده می کنیم.
شکل(13)
این مدل از یک کنترل کننده فیدبک تشکیل شده که پایداری سیستم را تضمین می کند و یک کنترل کننده Feedforward تطبیقی که فرایند کنترل را بهبود می دهد.خروجی کنترل کننده فیدبک توسط رابطه زیر داده می شود:
که Y(t) خروجی واقعی سیستم است.ایده کلیدی در یادگیر ی خطای فیدبک استفاده از خروجی کنترل کننده فیدبک ufb بعنوان سیگنال خطا برای کنترل کننده Feedforward تطبیقی است:
خروجی کنترل بوسیله مجموع هر دو کنترلر داده می شود:
اگر یادگیری کامل شود یعنی y(t)=yd(t) آنگاه کنترلر Feedforward (G) باید بصورت معکوس F-1 سیستمy=F(u) شود.همانطور که دیده می شود در این مدل نیز ما به نحوی فرایند یادگیری را که همان کسب مهارت باشد داریم.
.2-3 مدل بیوفیدبک پس از رسیدن فرد به مهارت
در این حالت دیگر مسیر فیدبک خارجی قطع می شود. در این حالت میتوانیم مدلسازی سیستم بیو فیدبک را با ساده ترین نوع کنترل بالستیک مدلسازی نمود.حرکت بالستیک نوعی حرکت است که در آن برنامه ایی دقیق و از پیش تنظیم شده و بدون استفاده از سیستم پسخورد مسئولیت حرکت و کنترل آنرا بر عهده دارد.بعبارت دیگر ما یک فعالیت از پیش برنامه ریزی شده را داریم. در اینگونه فعالیت پس از ارده نمودن فعالیت، مجموعه ای از الگو ها و دستور العمل ها به ترتیب و به تدریج در طول زمان و در مکانهای خاص به عملگرها ارسال شده و تحقق می یابد. و پس انجام فعالیت اراده شده ، کنترل ثانوی و با استفاده از پسخوراند انجام نشده بلکه عملکرد کنترلی اینگونه از فعالیتها بر پایه روند محاسباتی و کنترل ابتدایی پایه ریزی شده است و کنترل لحظه به لحظه و بر مبنای موقیت های مختلف به سیستم اعمال نمی گردد.شکل زیر شمایی از یک حرکت یا فعالیت بالستیک است.
شکل(14)
هر چند که این مدل کیفی معایب بسیاری دارد (از جمله حساس بودن نسبت به اغتشاش و اینکه مغز نمی تواند تمامی الگو ها را در خود ذخیره کند) اما در صورتیکه فعالیتی برای انسان کاملا ماهرانه شد چون سیستم کنترل بصورت مدار باز عمل می کند و از برنامه تهیه شده و ذخیره شده در مغز برای کنترل سود می جوید لذا نحوه کنترل مشابه با کنترل حرکات بالستیک خواهد شد.مدل کنترل بالستیک آن چیزی است که پس از بدست آمدن مهارت حاصل می شود.
برداشت دیگری که می توان از کسب مهارت در فرایند بیو فیدبک داشت اینست که در این حالت دیگر فیدبک خارجی وجود ندارد و حذف می شود در این حالت مدل یادگیری تقویت شده(Reinforcment Learning) دیگر مسیر فیدبک ندارد و ما شکل زیر را خواهیم داشت:
شکل(15)
نکته ایی که می بایست در اینجا به آن توجه شود اینست که هرچند در اینجا مسیرهای فیدبک خارجی قطع شده اند ولی ما هنوز هم سیگنال پاداش را برای تابع ارزشی داریم.که در مورد مدل یادگیری TD این موضوع توسط آزمایشی به اثبات رسیده است[5].در این حالت تابع ارزشی ما دیگر متغیر با زمان نخواهد بود و به یک مقدار بهینه رسیده و در آن ثابت باقی می ماند
V(X(t))=E[r+γV]
و
δ(t)=r+ V(γ-1)
همانطور که مشخص است در اینجا انتخاب یک فعالیت از بین چند تا انجام نمی شود بلکه فقط یک گزینه برای انتخاب وجود دارد. که در صورتیکه شخص اراده و قصد انجام آن فعالیت را داشته باشد با توجه به اینکه آموزشها دیده شده است و مهارت کسب شده مدل مربوط به آن فعالیت فراخوانی شده و بر طبق آن ، فعالیت مورد نظر انجام خواهد گرفت.در اینحالت نرخ یادگیری به سمت صفر میل کرده و بسیار کوچک است.بنحوی که می توان از آن صرف نظر نمود.
.2-4بهبودی و تغییر نقطه کار
در بخشهای قبل مدلهایی برای بیوفیدبک پیش از رسیدن فرد به مهارت و همینطور پس از کسب مهارت ذکر شد. ولی هدف نهایی بیوفیدبک چیست.آیا رسیدن به این نقطه که فرد بدون گرفتن فیدبک خارجی و صرفا با استفاده از یک ورودی اختیاری(اراده کردن) بتواند یک تابع بیولوژیکی را کنترل کند کافیست؟ البته مسلما هدف نهایی بهبودی کامل است که ما معتقدیم در بیو فیدبک این کار انجام میشود.اما برای توضیح اینکه چگونه این فرایند اتفاق می افتد می توان اینگونه تعبیر کرد که پس از هر بار تغییر وزنهای شبکه توسط یک فرد شبکه دوباره به حالت اولیه به طور کامل باز نمی گردد.بعبارت دیگر ما یک ضریب فراموشی را برای بازگشت به حالت اولیه در نظر می گیریم.بنابراین اگر در وضعیت اولیه ما φ(ωi) را داشته باشیم پس از تکرار وظیفه بیو فیدبک ، این وزنها تغییر می کند و به سمتφ(ωs) که حالت مطلوب و مورد نظر است میل می کند. که رابطه زیر می تواند این مورد را بیان کند:
φ(ω)= [φ(ωi)+αn φ(ωs)]/n+1
که در این رابطه α ضریب همگرایی است.یعنی میزان نزدیک شدن ما به وزنهای بهینه.این ضریب را از این جهت در نظر گرفتیم که ما همانطور که به وضعیت قبلی بطور کامل باز نمی گردیم به وضعیت جدید نیز بطور 100% نمی رسیم.البته این رابطه بصورت نظری بیان شده و در عمل ممکن است اینگونه نباشد و ضرایب متفاوت باشند، ولی چیزی که برای ما معلوم است اینست که ما تغییر تدریجی وزنها را خواهیم داشت.
بخش سوم
.3-1نتایج
در بیوفیدبک دو فرایند انجام می شود. یکی یادگیری انجام یک فرایند و دوم انجام یک فعالیت مرتبط با آن است.که این دو از یکدیگر جدا نشدنی و همراه هم هستند و بصورت همزمان انجام می پذیرد.در بیو فیدبک فعالیت می تواند کنترل یک تابع بیولوژیکی و یا حتی یک حرکت ساده دست یا پا باشد.ما در اینجا از مدل یادگیری تقویت شده برای مدل کردن بیوفیدبک استفاده کردیم.پس از آن با توجه به بلوکهای موجود در مدلمان قسمتهایی از مغز را که مرتبط با این مدل بوده باز کرده و مدلهای مربوط به آنها ارائه شد که این بخشها به ترتیب عبارت بودند از :قشر مغز، باسال گانگلیا ، آمیگدال و مخچه.
همچنین مدلهای مرتبط با بیوفیدبک پس از رسیدن فرد به مهارت و پس از اینکه یک فرد آموزش می بیند و دیگر نیازی به فیدبک خارجی ندارد ارائه کردیم ، که در اینجا دو مدل مشابه که در حقیقت یک مدل هستند یعنی مدل یادگیری تقویت شده بدون مسیر فیدبک خارجی و مدل بالیستیک را استفاده کردیم.روابط مربوط به این قسمت نیز با توجه به روابطی که برای قسمت اول ارائه شده بود بیان شد.
در مورد اینکه بهبودی در بیو فیدبک چیست و چگونه حاصل می شود و اینکه وزنهای شبکه عصبی ما در حالت بهبودی به مقدار مطلوب تغییر می کند نیز بحث شد.رابطه ایی نیز برای آن در انتها ذکر گردید.
.3-2بحث ونتیجه گیری
در مورد تکنیک درمانی بیو فیدبک تا کنون مدلهای چندانی ارائه نشده است. این پروژه با هدف توسعه هرچه بیشتر این روش درمانی ، که نسبت به روشهای متداول دیگر عوارض بسیار کمتری دارد ، صورت گرفته است.البته با توجه به کمی تحقیقات انجام شده در این زمینه و نبود داده های لازم امکان مدلسازی بیوفیدبک در حد مطلوب فراهم نشد.لیکن قدمی هرچند کوتاه در مسیری بلند بر داشته شد.
ما در اینجا با استفاده از مدلهای سیستمهای عصبی-عضلانی به مدلسازی بیوفیدبک اقدام کردیم.در نظر اول شاید تفاوتهای بسیاری بین بیو فیدبک و سیستمهای عصبی- عضلانی به نظر برسد ولی اگر با نگاه موشکافانه تری به قضیه بنگریم مشاهده می کنیم که ایندو با هم نقاط مشترک فراوانی دارند که وجود یادگیری در هردو یکی از این نقاط اشتراک است و این استفاده از مدلهای یکی را برای دیگری ممکن می سازد.
کارهای انجام شده قبلی در این زمینه در مرجع[3] آورده شده است، که با توجه به اینکه اولین کار در این زمینه بوده است دارای ایراداتی می باشد که از آنجمله می توان به کامل نبودن آن و اینکه مدل ارائه شده فاقد سیگنال پاداش بود اشاره کرد.در فرایند یادگیری یکی از مهمترین ورودیها به سیستمها سیگنال پاداش یا تنبیه است که موجب یادگیری(توسط ارزش گزاری روی که فعالیت یا وضعیت) و به خاطر سپاری می شود.در صورتیکه ورودی مذکور وجود نداشته باشد، عمل یادگیری در مغز یا انجام نمی شود و یا اینکه به سرعت از ذهن محو می شود.ما با در نظر گرفتن ورودی پاداش و فیدبکهای محیطی مدل یادگیری تقویت شده را برای بیوفیدبک پیشنهاد کردیم.به دنبال آن برای بخشهایی که مرتبط با این مدل متصور بودیم و نتایج fMRI آن را تایید می کرد ، مدل مناسبی ذکر شد.این پروژه بر استدلالات منطقی و داده های fMRI مربوط به بیوفیدبک ریلکسیشن در توصیف و بیان مدلها ، تکیه دارد.هرچند که شاید در بخشی از موارد این مدلها و توصیفها نتوانند بطور کامل فرایند بوقوع پیوسته را شرح دهند.
دادهای fMRI بدست آمده حاکی از این مطلب بود که در بیو فیدبک نیز نقاطی از مغز مشابه با هنگامیکه یک فعالیت حرکتی و عضلانی صورت می گیرد ، شروع به فعالیت می کنند.البته توضیح این مطلب که چگونه ایندو در این مورد خواص به هم نزدیک هستند بسیار ساده می تواند باشد و آن اینست که سوژه ها در هنگام انجام عمل بیوفیدبک ریلکسیشن احتمالا از تصاویر ذهنی مرتبط با حرکت کمک می گرفته اند که این امر موجب نزدیکی و مشابهت ایندو فرایند به یکدیگر شده است.البته با توجه به موارد گفته شده ما انتظار نزدیک بودن این دو را جدای از مطلبی که گفته شد،داریم.حتی در برخی موارد که ما فیدبک حرکت را برای انجام فعالیتهای حرکتی داریم می بایست از مدلهای عصبی عضلانی برای این منظور استفاده کنیم.با توجه به این موارد می توانیم بگوییم راهی را که در این پروژه پیموده ایم تا حد زیادی می تواند صحیح باشد.
در اینجابرای ادامه کار در این زمینه و برای اثبات صحت درستی نتایج بدست آمده می بایست اعتبار این نظریات اثبات شود.
در این پروژه هدف ما انجام عمل ریلکسیشن و رسیدن به آرامش خواهد بود. در این راستا ما می توانیم با استخراج ویژگیهای گلوبال نظیر : مولفه لیاپانوف ، بعد فراکتال و بعد همبستگی یک حالت واحد را برای مغز قبل از عمل بیو فیدبک مشخص کنیم .که این حالت را در فرد به عنوان حالت مریضی در نظر می گیریم(در صورتیکه فرد مورد نظر دارای مشکل عدم آرامش باشد).
در این جا ما معتقدیم که فرد می تواند بصورت اختیاری و در صورتیکه فیدبکهای مناسب به وی اعمال شود این ویژگیها را تغییر دهد.که ما در اینجا از فیدبک EEG به این منظور استفاده خواهیم نمود. با توجه به این مطلب مشخص است که ما ویژگیها را از روی سیگنال EEG استخراج می نماییم.اما با توجه به اینکه ریلکسیشن ، هم در سیگنال EEG نمود پیدا می کند و هم در سایر پاسخهای بدنی مانند EDA و ضربان نبض و… ، می توان این موارد را نیز به فرد فیدبک کرد.
بردار حاصل از استخراج این پارامترها می تواند حالات گوناگون مغزی را برای ما مشخص کند که در این حال ما می توانیم هم برای حالات مغزی قبل از انجام بیو فیدبک و هم بعد از آن یک حالت متناظر داشته باشیم. همچنین در هنگامیکه فرد عمل بیو فیدبک را انجام می دهد انتظار داریم نوروترانسمیتر دوپامین بیشتری نسبت به حالت عادی ترشح شود که این نیز قابل اندازه گیری است و وجود سیگنال پاداش را اثبات می کند.
همچنین با توجه به ماهیت مشخصه هایی که قصد اندازه گیری آنها را داریم می توانیم انتظار داشته باشیم که این مولفه ها کاهش یابند. و این به این خاطر است که ما برای مغز در حالت نرمال یک حالت آشوب گونه در نظر می گیریم و بیماری را نوعی سنکرون شدن در بخشی از مغز می دانیم پس توقع داریم که با حرکت در سمت صحیح و پیشرفت به سوی بهبودی مجددا به حالت آشوب گونه باز گردیم.
آنچه که ما در اینجا – با توجه به بحثهای نظری انجام شده – انتظار آنرا داریم اینست که در هر بار انجام این تمرینات به درصدی از بهبودی دست پیذا کنیم. به این ترتیب که بردار مولفه استخراج شده را در هر جلسه تمرین تا آنجا که مقدور باشد به سمت حالت مورد نظر هدایت می کنیم. پس اتمام هر جلسه در انتها این بردار به حالت اولیه اما نه بطور کامل باز خواهد گشت که طبق نظریات ارایه شده بعد از چند ین جلسه تمرین یک سوژه باید به درصدی از تغییر در حالت مغزی بطور دائم دست پیدا کند.
در نهایت ما با این روش انتظار دست یافتن به سه هدف و در حقیقت اثبات آنها را داریم:
- اول اینکه در بیو فیدبک ما قادر به تغییر حالت مغز حتی به مقدار کم بصورت دائمی هستیم( رسیدن به بهبودی و سلامت).یعنی باقی ماندن فرد در حالت مغزی مناسب.
- دوم اینکه با نبود فیدبک خارجی فرد می تواند خود را به حالت مغزی مناسب برساند.(حذف مسیر فیدبک خارجی پس از رسیدن فرد به مهارت).
- سوم ، بررسی تغییر حالت مغز در بیو فیدبک است که ما به آن معتقدیم واینکه این تغییر آیا بصورت پیوسته اتفاق می افتد یا بصورت پله ایی.
همچنین ما قادر به بررسی اینکه در هر بار انجام بیو فیدبک ریلکسیشن چه مقدار تغییر در حالت مغزی را داریم خواهیم بود. و این نکته از این جهت حائز اهمیت است که می تواند میزان کارایی این روش درمانی و اینکه آیا ما واقعا می توانیم به نقطه کار بهینه برسیم یا نه را برای ما تبیین میکند.
مراجع
[1] هاشمی گلپایگانی. محمد رضا “درس سیستمهای عصبی-عضلانی”
[2] غفاری احمد ،خلیل زاده محمد علی. ” بررسي الكتروفيزيولوژي EEG در بيوفيدبك ريلكسيشن” پروژه درس الکتروفیزیولوژی (1376)
[3] Nishimura.C et al. “A mathe matical model of biofeedback and its relation to the neural activity” The 3rd European Medical and Biological Engineering Conference(2005)
[4]Kritchely H.D et al. “Brain activity during biofeedback relaxation a functional neuro imaging investigation” Oxford university press (2001)
[5] Kenji Doya et al. “Neural mechanisms of learning and control” IEEE control system magazine(2001)
[6] D.P. Bertsekas and J.N. Tsitsiklis, Neuro-Dynamic Programming. Belmont,
MA: Athena Scientific, 1996.
[7] W. Schultz, P. Dayan, and P.R. Montague, “A neural substrate of prediction
and reward,” Science, vol. 275, pp. 1593-1599, 1997
[8] رابرت .بی.گراهام. ترجمه: دکتر علی رضا رجایی و علی اکبر صارمی “روانشناسی فیزیولوژیک” چاپ سوم 1384 ص(104 تا 126).
[9] J.C. Houk, J.L. Adams, and A.G. Barto, “A model of how the basal ganglia generate and use neural signals that predict reinforcement,” in Models of Information Processing in the Basal Ganglia, J.C. Houk, J.L. Davis, and D.G.
Beiser, Eds. Cambridge, MA: MIT Press, 1995, pp. 249-270.
[10] آدرنوش.مهدی و هاشمی گلپایگانی محمد رضا و خلیل زاده محمد علی.”شبیه سازی مدل محاسباتی یادگیری احساسی در آمیگدالا” تابستان 1383.
[11] Jan Moren, Christian Balkenius,”A Computational Model of Emotional Learning in the Amygdala”, Lund University Cognitive Science 2000.
[12] M. Lotze, P. Montoya,M. Erb, E. Hulsmann,H. Flor,U. Klose,N. Birbaumer,and W. Grodd,“Activation of cortical and cerebellar motor areas during executed and imagined hand movements: An fMRI study,” J. Cognitive Neurosci.,vol. 11, pp. 491-501, 1999.