# -*- coding: utf-8 -*-
"""
Process the textgrid files
"""
import argparse
import codecs
from distutils.util import strtobool
from pathlib import Path
import textgrid
import pdb

class Segment(object):
    def __init__(self, uttid, spkr, stime, etime, text):
        self.uttid = uttid
        self.spkr = spkr
        self.spkr_all = uttid+"-"+spkr
        self.stime = round(stime, 2)
        self.etime = round(etime, 2)
        self.text = text
        self.spk_text = {uttid+"-"+spkr: text}

    def change_stime(self, time):
        self.stime = time

    def change_etime(self, time):
        self.etime = time


def get_args():
    parser = argparse.ArgumentParser(description="process the textgrid files")
    parser.add_argument("--path", type=str, required=True, help="Data path")
    parser.add_argument(
        "--no-overlap",
        type=strtobool,
        default=False,
        help="Whether to ignore the overlapping utterances.",
    )
    parser.add_argument(
        "--max_length",
        default=100000,
        type=float,
        help="overlap speech max time,if longger than max length should cut",
    )
    parser.add_argument(
        "--overlap_length",
        default=1,
        type=float,
        help="if length longer than max length, speech overlength shorter, is cut",
    )
    parser.add_argument(
        "--mars",
        type=strtobool,
        default=False,
        help="Whether to process mars data set.",
    )
    args = parser.parse_args()
    return args


def preposs_overlap(segments,max_length,overlap_length):
    new_segments = []
    # init a helper list to store all overlap segments
    tmp_segments = segments[0]
    min_stime = segments[0].stime
    max_etime = segments[0].etime
    overlap_length_big = 1.5
    max_length_big = 15
    for i in range(1, len(segments)):
        if segments[i].stime >= max_etime:
            # doesn't overlap with preivous segments
            new_segments.append(tmp_segments)
            tmp_segments = segments[i]
            min_stime = segments[i].stime
            max_etime = segments[i].etime
        else:
            # overlap with previous segments
            dur_time = max_etime - min_stime
            if dur_time < max_length:
                if min_stime > segments[i].stime:
                    min_stime = segments[i].stime
                if max_etime < segments[i].etime:
                    max_etime = segments[i].etime
                tmp_segments.stime = min_stime
                tmp_segments.etime = max_etime
                tmp_segments.text = tmp_segments.text + "src" + segments[i].text
                spk_name =segments[i].uttid +"-" + segments[i].spkr
                if spk_name in tmp_segments.spk_text:
                    tmp_segments.spk_text[spk_name] += segments[i].text 
                else:
                    tmp_segments.spk_text[spk_name] = segments[i].text
                tmp_segments.spkr_all = tmp_segments.spkr_all + "src" + spk_name
            else:
                overlap_time = max_etime - segments[i].stime 
                if dur_time < max_length_big:
                    overlap_length_option = overlap_length
                else:
                    overlap_length_option = overlap_length_big
                if overlap_time > overlap_length_option:
                    if min_stime > segments[i].stime:
                        min_stime = segments[i].stime
                    if max_etime < segments[i].etime:
                        max_etime = segments[i].etime
                    tmp_segments.stime = min_stime
                    tmp_segments.etime = max_etime
                    tmp_segments.text = tmp_segments.text + "src" + segments[i].text
                    spk_name =segments[i].uttid +"-" + segments[i].spkr
                    if spk_name in tmp_segments.spk_text:
                        tmp_segments.spk_text[spk_name] += segments[i].text 
                    else:
                        tmp_segments.spk_text[spk_name] = segments[i].text
                    tmp_segments.spkr_all = tmp_segments.spkr_all + "src" + spk_name
                else:
                    new_segments.append(tmp_segments)
                    tmp_segments = segments[i]
                    min_stime = segments[i].stime
                    max_etime = segments[i].etime
                    
    return new_segments

def filter_overlap(segments):
    new_segments = []
    # init a helper list to store all overlap segments
    tmp_segments = [segments[0]]
    min_stime = segments[0].stime
    max_etime = segments[0].etime

    for i in range(1, len(segments)):
        if segments[i].stime >= max_etime:
            # doesn't overlap with preivous segments
            if len(tmp_segments) == 1:
                new_segments.append(tmp_segments[0])
            # TODO: for multi-spkr asr, we can reset the stime/etime to
            # min_stime/max_etime for generating a max length mixutre speech
            tmp_segments = [segments[i]]
            min_stime = segments[i].stime
            max_etime = segments[i].etime
        else:
            # overlap with previous segments
            tmp_segments.append(segments[i])
            if min_stime > segments[i].stime:
                min_stime = segments[i].stime
            if max_etime < segments[i].etime:
                max_etime = segments[i].etime

    return new_segments


def main(args):
    wav_scp = codecs.open(Path(args.path) / "wav.scp", "r", "utf-8")
    textgrid_flist = codecs.open(Path(args.path) / "textgrid.flist", "r", "utf-8")

    # get the path of textgrid file for each utterance
    utt2textgrid = {}
    for line in textgrid_flist:
        path = Path(line.strip())
        uttid = path.stem
        utt2textgrid[uttid] = path

    # parse the textgrid file for each utterance
    all_segments = []
    for line in wav_scp:
        uttid = line.strip().split(" ")[0]
        uttid_part=uttid
        if args.mars == True:
            uttid_list = uttid.split("_")
            uttid_part= uttid_list[0]+"_"+uttid_list[1]
        if uttid_part not in utt2textgrid:
            print("%s doesn't have transcription" % uttid)
            continue

        segments = []
        tg = textgrid.TextGrid.fromFile(utt2textgrid[uttid_part])
        for i in range(tg.__len__()):
            for j in range(tg[i].__len__()):
                if tg[i][j].mark:
                    segments.append(
                        Segment(
                            uttid,
                            tg[i].name,
                            tg[i][j].minTime,
                            tg[i][j].maxTime,
                            tg[i][j].mark.strip(),
                        )
                    )

        segments = sorted(segments, key=lambda x: x.stime)

        if args.no_overlap:
            segments = filter_overlap(segments)
        else:
            segments = preposs_overlap(segments,args.max_length,args.overlap_length)
        all_segments += segments

    wav_scp.close()
    textgrid_flist.close()

    segments_file = codecs.open(Path(args.path) / "segments_all", "w", "utf-8")
    utt2spk_file = codecs.open(Path(args.path) / "utt2spk_all", "w", "utf-8")
    text_file = codecs.open(Path(args.path) / "text_all", "w", "utf-8")
    utt2spk_file_fifo = codecs.open(Path(args.path) / "utt2spk_all_fifo", "w", "utf-8")

    for i in range(len(all_segments)):
        utt_name = "%s-%s-%07d-%07d" % (
            all_segments[i].uttid,
            all_segments[i].spkr,
            all_segments[i].stime * 100,
            all_segments[i].etime * 100,
        )

        segments_file.write(
            "%s %s %.2f %.2f\n"
            % (
                utt_name,
                all_segments[i].uttid,
                all_segments[i].stime,
                all_segments[i].etime,
            )
        )
        utt2spk_file.write(
            "%s %s-%s\n" % (utt_name, all_segments[i].uttid, all_segments[i].spkr)
        )
        utt2spk_file_fifo.write(
            "%s %s\n" % (utt_name,  all_segments[i].spkr_all)
        )
        text_file.write("%s %s\n" % (utt_name, all_segments[i].text))

    segments_file.close()
    utt2spk_file.close()
    text_file.close()
    utt2spk_file_fifo.close()


if __name__ == "__main__":
    args = get_args()
    main(args)