تکنیک های آموزش ورزش والیبال قسمت شانزدهم

ساخت وبلاگ
کنترل بعدی به مرحله n بستگی دارد ، به کنترل اعمال شده بر مرحله فعلی 1 − ،
و در سطح تلاش و خستگی در آن مرحله ، نتیجه فرآیند بهینه سازی یک سیاست است
به شکل یک جدول جستجو ، که کنترل بهینه برای هر پیکربندی سیستم را ترسیم می کند.
در مدل DP برای تعریف یک تابع پاداش مناسب r (xn) بسیار مهم است. همانطور که قبلاً گفته شد ،
اگر تلاشی که ورزشکار در طول مرحله انجام داده است باید مقدار این عملکرد بیشتر باشد
بالاتر است ، اما در صورت رسیدن به آستانه خستگی مجازات اعمال می شود. برای این هدف ما
تابع پاداش بعدی را انتخاب کرده اند: (xn ، un) = −αFn + βEn (5)
جایی که α و β پارامترهای قابل تنظیم سیستم هستند. به عنوان مثال ، مقادیر آنها برای
آزمونهای اعتبار سنجی انجام شده در بخش IV-D 5 = α و 3 β = بود
مقادیر ، ارزش پاداش منفی نشان دهنده بیش از حد آموزش است ، در حالی که مقدار پاداش مثبت نشان می دهد
که این تمرین بیشتر در محدوده مشخص شده تلاش انجام شده است. یووینعلاوه بر این ، در
این پاداش مورد قطعی است ، بنابراین E [r (xn)] از این پس با خیال راحت به صورت r (xn) بیان می شود.
قوانین بازی فوتبال...
ما را در سایت قوانین بازی فوتبال دنبال می کنید

برچسب : یووین, نویسنده : ناشناس uwin05 بازدید : 112 تاريخ : يکشنبه 20 مهر 1399 ساعت: 17:41