Skip to content
Snippets Groups Projects
Commit 72e2e47d authored by maberet's avatar maberet
Browse files

Merge branch 'main' into qlearn

parents 9be22fa0 3f8041c2
No related branches found
No related tags found
No related merge requests found
Showing
with 308 additions and 0 deletions
run
q.txt
# Prerequisites
*.d
......
{
"configurations": [
{
"name": "Linux",
"includePath": [
"${workspaceFolder}/**",
"/usr/include/SDL2"
],
"defines": [],
"compilerPath": "/usr/bin/gcc",
"cStandard": "gnu17",
"cppStandard": "gnu++14",
"intelliSenseMode": "linux-gcc-x64"
}
],
"version": 4
}
\ No newline at end of file
,meyer,pc-meyer,23.06.2022 23:09,file:///home/meyer/.config/libreoffice/4;
\ No newline at end of file
No preview for this file type
CC=gcc
LDFLAG=$(shell sdl2-config --cflags --libs) -lm -lSDL2_ttf -D_REENTRANT -lSDL2_image -pthread
CFLAG=-Wall $(shell sdl2-config --cflags --libs)
EXEC=run
SRC=$(wildcard src/*.c)
OBJ=$(SRC:.c=.o)
all:$(EXEC)
$(EXEC):$(OBJ)
$(CC) -o $@ $^ $(LDFLAG)
mv $^ bin/
%.o:%.c
$(CC) -o $@ -c $< $(CFLAG)
.PHONY:clean
clean:
rm -rf bin/*.o
rm -rf $(EXEC)
\ No newline at end of file
Projet ZZ1
Apprentissage par renforcement
Groupe : 5
Membres : Taha Belkhiri, Marc Beret et Antoine Meyer
Définition apprentissage par renforcement :
Programme/agent/système qui réalise une suite d'actions et après un certain laps de temps, qui évalue la qualité de l'état atteint. On remonte alors dans la liste des actions réalisées et on augmente(si éval. finale favorable) leur probabilité de réalisation ou on la diminue (défavorable).
But :
Apprendre à un programme à prendre des décisions.
Besoins :
- un environnement
- des actions/perceptions dans cet environnement
- un agent
Problèmes :
- nombre de simulations très important
- réglage de ξ est laborieux et assez dépendant du problème
Suites décroissantes de limite nulle :
Choix parmis 3 suites.
[4.2.2 La formule de mise à jour]
Formule de mise à jour avec forme de suite : Un+1 = Un + ξ × (a−Un) avec 0<ξ<1
Etendu du résultat à une suite de réalisations d'une variable aléatoire :
- suite de variables aléatoires (An), identiquement distribuées en fonction de n et admettant une même espérance A,
- suite de variables aléatoires (Un) par Un+1 = Un + ξ × (An−Un),
- suite des espérances des variables Un par Vn = E(Un).
Choix de ξ :
- ξ petit (proche de 0) => fluctuations de faible amplitude
- ξ grand (proche de 1) => convergence rapide
- => trouver un compromis et expliquer notre choix !
[4.3 Apprentissage par renforcement]
Mécanisme :Z
1 - regarder le monde
2 - choisir une action
3 - percevoir une récompense
4 - faire un retour d'expérience pour améliorer les choix
[4.4 Qualité d'une action ou d'un état]
IDEES :
- jeu de société
- un jeu avec un petit plateau, un personnage entre, tue un monstre, recupere une cle et sort du plateau. Là le jeu recommence mais le monstre a apprit comment il s'est fait tué. Donc au 2eme tour, il va tenter d'autres moves pour mieux survivre. Tuer le monstre devient donc de + en + compliqué surtout si le joueur si prend de la même manière.
- jeu tower defense où l'algorithme doit défendre des monstres lancés par le joueur.
- une fée soigne et assiste un héro. Elle lui donne de la vie, du mana avec un apprentissage pour être le meilleur soutien possible.
- village avec des pnjs dedans.
- pnj1_pablo : protege la fontaine
- pnj1_
- joueur : clic sur la fontaine , elle perd 3 HP
- il y a un hero il a de la vie, de l'argent, de la mana, de l'attaque, de la défense. Il y a un marchand avec des potions, des épées, etc. Et c'est le marchand, connaissant les stats du héro, qui lui donne un item au hasard qui correspond le mieux a la situation du hero.
File added
travail_de_groupe/jeu_appren_par_renfo/antoi_render_2d/assets/background_mat.png

1.05 MiB

File added
CC=gcc
LDFLAG=$(shell sdl2-config --cflags --libs) -lm -lSDL2_ttf -D_REENTRANT -lSDL2_image -pthread
CFLAG=-Wall $(shell sdl2-config --cflags --libs)
EXEC=run
SRC=$(wildcard source/*.c)
OBJ=$(SRC:.c=.o)
all:$(EXEC)
$(EXEC):$(OBJ)
$(CC) -o $@ $^ $(LDFLAG)
mv $^ bin/
%.o:%.c
$(CC) -o $@ -c $< $(CFLAG)
.PHONY:clean
clean:
rm -rf bin/*.o
rm -rf $(EXEC)
\ No newline at end of file
#include "ball.h"
ball_t ball;
void initBall(){
}
\ No newline at end of file
#ifndef BALL_H
#define BALL_H
typedef struct ball{
int x;
int y;
} ball_t;
extern ball_t ball;
void initBall();
#endif
\ No newline at end of file
#include "canon.h"
canon_t canon;
void initCanon(){
canon.width = 20;
canon.height = 10;
canon.length = 20;
canon.x = 100;
canon.y = 20;
canon.zone = 1;
}
int getZone(int terrainX, int terrainY, int terrainW, int terrainH){
int z = -1;
int xCanonTopView = terrainX + canon.x;
int yCanonTopView = terrainY + canon.y;
//en haut à gauche => 1
if(canon.x >= 0 && canon.x<terrainW/2 && yCanonTopView>=0 && canon.y<terrainH/4){
z = 1;
}
//en haut à droite => 2
else if(xCanonTopView>=terrainX+terrainW/2 && xCanonTopView<=terrainX+terrainW && yCanonTopView>=terrainY && yCanonTopView<terrainX+terrainH/4){
z = 2;
}
//en bas à gauche => 3
else if(xCanonTopView >= terrainX && xCanonTopView<terrainX+terrainW/2 && yCanonTopView>=terrainY+terrainH/4 && yCanonTopView<=terrainH+terrainH/2){
z = 3;
}
//en bas à droite => 4
else{
z = 4;
}
return z;
}
\ No newline at end of file
#ifndef CANON_H
#define CANON_H
typedef struct canon{
int x;
int y;
int width;
int height;
int length;
int zone;
} canon_t;
extern canon_t canon;
void initCanon();
int getZone(int, int, int, int);
#endif
\ No newline at end of file
#include "gest_event.h"
SDL_Point mousePosition;
void manageGame(){
SDL_Event event;
while (SDL_PollEvent(&event)){
switch(event.type)
{
case SDL_QUIT:
running = 0;
break;
case SDL_KEYUP:
switch (event.key.keysym.sym)
{
case SDLK_ESCAPE:
running = 0;
continue;
default:
continue;
}
break;
case SDL_KEYDOWN:
switch (event.key.keysym.sym)
{
case SDLK_ESCAPE:
running = 0;
continue;
case SDLK_e:
initPointDeChute();
zone_chute = getZoneChute(terrain.x, terrain.y, terrain.w, terrain.h);
break;
case SDLK_r:
newCanon();
zone_canon = getZone(terrain.x, terrain.y, terrain.w, terrain.h);
break;
default:
continue;
}
break;
case SDL_MOUSEMOTION:
continue;
case SDL_MOUSEBUTTONDOWN:
//
break;
default:
continue;
}
}
SDL_Delay(5);
}
void *eventLoop(void *arg){
while(running){
manageGame();
}
return NULL;
}
\ No newline at end of file
#ifndef _GEST_EVENT_H_
#define _GEST_EVENT_H_
#include "main.h"
#include "render.h"
void manageGame();
void *eventLoop(void *);
#endif
\ No newline at end of file
#include "main.h"
int running;
int main(){
running = 1;
mainLoop();
}
\ No newline at end of file
#ifndef _MAIN_HEADER_
#define _MAIN_HEADER_
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
#include <unistd.h>
#include <SDL2/SDL.h>
#include <SDL2/SDL_image.h>
#include <SDL2/SDL_ttf.h>
#include <pthread.h>
#include "render.h"
extern int running;
int main();
#endif
\ No newline at end of file
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment