A software tool for designing adaptive control systems based on reinforcement learning
ÖZET Pekiştirmeli Öğrenmeye Dayalı Denetlenebildi Düzeneklerin Tasarlanabilmesi İçin Bir Araç Pekiştirmeli öğrenmeye dayalı, denetlenebildi düzeneklerin tasarlanabilmesi için, çok az sayıda geliştirilmiş araç vardır ve bu araçlar, belli sorunların çözülmesine yönelik geliştirilmiş özel amaçlı araçlardır([3], [4]). Literatürde genel amaçlı bu tür bir araca rastlanmamıştır. Bu tür düzeneklerin tasanmlanabilmesi ve kullanılabilmesi, birçok ekonomik ve bilimsel sorunların daha hızlı ve daha güvenilir bir şekilde irdelenmesine ve çözülmesine yardımcı olacaktır. Bu tez çalışmasında, bu tür düzeneklerin geliştirilmesi için bir araç geliştirilmiş ve bir uygulama ve örnek çalışmalar ile bu aracın kullanımı sağlanmıştır. Bu aracın amacı; doğrusal olmayan, karmaşık düzeneklerin modellenmesini ve denetlenmesini sağlamak, öğrenen yöntemlerle irdelenmesine ve böylece, bu düzeneklerle ilgili olası sorunlara, daha nitelikli çözümler bulunmasına yardımcı olmaktır. Bu araç, değişken ve sabit yapılı otomatlarla, karmaşık düzeneklerin modellenmeleri ve irdelenmeleri için kullanılabilir. Ayrıca bu tezde iki uygulama ve örnek çalışmalar, araç kullanılarak gerçekleştirilmiştir. Birinci uygulama, çalışanların işlerle ilgili becerilerinin sabit kaldığı ortamdaki iş dağıtımıdır. Bu, iş dağıtımının uygun şekilde yapılmasını ve kişilere uygun işlerin verilmesini sağlayan bir uygulamadır. Bu uygulamadaki bilinen yöntem, iş dağılımını, değişmez sıra ile çalışanlara dağıtma yaklaşımıdır. İkinci uygulama ise bir arabaya, sadece öne veya arkaya hareket edebilecek şekilde bir ucundan bağlanmış bir sopayı, arabayı ileri geri hareket ettirerek dengede tutmayı, düşürmemeyi öğrenmeye çalışan bir uygulamadır. Değişken yapılı otomatların, pekiştirmeli öğrenme ve parametrelerdeki çeşitlilik ile kolayca uyum sağlayabilmesi, bu aracı, doğrusal olmayan düzeneklerde yeterli derecede esnek ve güçlü bir şekilde uygulanabilirliğini sağlar. Bu araçla oluşturulmuş örnek çalışmalar, III.4 bölümünde gösterilmiştir. Şubat, 2004 iv Murat BİŞİRGEN ABSTRACT A Software Tool For Designing Adaptive Control Systems Based On Reinforcement Learning There are a few tools for designing adaptive control systems based on reinforcement learning. They are used to provide solutions to specific problems [3, 4]. Also, there is not a known tool for general use in literature. These tools incorporate powerful adaptive techniques, which help to solve problems of scientific or economic interest. In this study, a tool for designing adaptive control systems based on reinforcement learning is developed and used in an application and in several sample problems showing the details of the tool. The goal of this study is to provide a powerful set of adaptive analysis techniques applicable to a wide range of highly complicated systems displaying nonlinear characteristics. In this tool, variable and fixed structure automata may be used to model and examine the complicated systems. In addition, two applications and several sample problems are implemented on the tool. The first application is the Job Assignment problem. In the first application, in which the abilities of the workers about their jobs are assumed to be stable, is extended to take into account the action and penalty probabilities not considered in the classic method. The second application is pushing the cart either left or right with a force so that the pole, which is hinged on the cart that may move left or right on a horizontal track, remains balance. The adaptability of variable structured automata by reinforcement learning and the diverse set of parameters makes this tool sufficiently flexible and powerful that it may be applicable to a wide range of systems displaying non-linear characteristic. Results of several sample problems by using this tool is shown in Part III.4. February, 2004 v Murat BIŞIRGEN