import matplotlib
import gym
import gym_vgdl
import numpy as np
import time

import os
import subprocess

from lib.helper import gen_log_dir
from lib import plotting, helper, induction

TIME_RANGE = 400
# env = gym.make('vgdl_aaa_field-v0')
# env = gym.make('vgdl_experiment1-v0')
# env = gym.make('vgdl_experiment3_before-v0')
# env = gym.make('vgdl_experiment3_after-v0')
env = gym.make('vgdl_experiment4_before-v0')
# env = gym.make('vgdl_experiment4_after-v0')

for i_episode in range(TIME_RANGE):

    # Reset the env and pick the first action
    state = env.reset()

    for t in range(TIME_RANGE):
        env.render()
        time.sleep(0.01)
        # Take a step
        action = env.action_space.sample()
        next_state, reward, done, _ = env.step(4)
        # next_state, reward, done, _ = env.step(action)
        if done:
            break
exit(1)
base_dir = os.path.dirname(os.path.abspath(__file__))

# stats = plotting.load_stats(base_dir, "vgdl_experiment4_after")
# stats_test = plotting.load_stats(base_dir, "vgdl_experiment4_after_test")

# stats2 = plotting.load_stats(base_dir, "vgdl_experiment4_after_q")
# stats2_test = plotting.load_stats(base_dir, "vgdl_experiment4_after_q_test")

# stats2 = plotting.load_stats(base_dir, "vgdl_experiment4_after_q")
# stats2_test = plotting.load_stats(base_dir, "vgdl_experiment4_after_q_test")


# stats_test = plotting.load_stats(base_dir, "vgdl_experiment1_q_test")
# import ipdb; ipdb.set_trace()

# plotting.plot_episode_stats_test(stats, stats_test)
# plotting.plot_episode_stats_test(stats2, stats2_test, smoothing_window=1)

# plotting.plot_episode_stats_simple(stats)

# plotting.plot_episode_stats_multiple(stats, stats2, smoothing_window=1)
# plotting.plot_episode_stats_multiple_test(stats_test, stats2_test, smoothing_window=1)