游雁
2024-02-19 94de39dde2e616a01683c518023d0fab72b4e103
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
// fstbin/fsts-union.cc
 
// Copyright 2016  Johns Hopkins University (Authors: Jan "Yenda" Trmal)
 
// See ../../COPYING for clarification regarding multiple authors
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//  http://www.apache.org/licenses/LICENSE-2.0
//
// THIS CODE IS PROVIDED *AS IS* BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
// KIND, EITHER EXPRESS OR IMPLIED, INCLUDING WITHOUT LIMITATION ANY IMPLIED
// WARRANTIES OR CONDITIONS OF TITLE, FITNESS FOR A PARTICULAR PURPOSE,
// MERCHANTABLITY OR NON-INFRINGEMENT.
// See the Apache 2 License for the specific language governing permissions and
// limitations under the License.
 
 
#include "base/kaldi-common.h"
#include "util/common-utils.h"
#include "fstext/fstext-utils.h"
#include "fstext/kaldi-fst-io.h"
 
 
int main(int argc, char *argv[]) {
  try {
    using namespace kaldi;
    using namespace fst;
    typedef kaldi::int32 int32;
    typedef kaldi::uint64 uint64;
 
    const char *usage =
        "Reads a kaldi archive of FSTs. Performs the FST operation union on\n"
        "all fsts sharing the same key. Assumes the archive is sorted by key.\n"
        "\n"
        "Usage: fsts-union [options] <fsts-rspecifier> <fsts-wspecifier>\n"
        " e.g.: fsts-union ark:keywords_tmp.fsts ark,t:keywords.fsts\n"
        "\n"
        "see also: fstunion (from the OpenFst toolkit)\n";
 
    ParseOptions po(usage);
 
    po.Read(argc, argv);
 
    if (po.NumArgs() != 2) {
      po.PrintUsage();
      exit(1);
    }
 
    std::string fsts_rspecifier = po.GetArg(1),
        fsts_wspecifier = po.GetArg(2);
 
 
    SequentialTableReader<VectorFstHolder> fst_reader(fsts_rspecifier);
    TableWriter<VectorFstHolder> fst_writer(fsts_wspecifier);
 
    int32 n_out_done = 0,
          n_in_done = 0;
    std::string res_key = "";
    VectorFst<StdArc> res_fst;
 
    for (; !fst_reader.Done(); fst_reader.Next()) {
      std::string key = fst_reader.Key();
      VectorFst<StdArc> fst(fst_reader.Value());
 
      n_in_done++;
      if (key == res_key) {
        fst::Union(&res_fst, fst);
      } else {
        if (res_key != "") {
          VectorFst<StdArc> out_fst;
          fst::Determinize(res_fst, &out_fst);
          fst::Minimize(&out_fst);
          fst::RmEpsilon(&out_fst);
          fst_writer.Write(res_key, out_fst);
          n_out_done++;
        }
        res_fst = fst;
        res_key = key;
      }
    }
    if (res_key != "") {
      VectorFst<StdArc> out_fst;
      fst::Determinize(res_fst, &out_fst);
      fst::Minimize(&out_fst);
      fst::RmEpsilon(&out_fst);
      fst_writer.Write(res_key, out_fst);
      n_out_done++;
    }
 
    KALDI_LOG << "Applied fst union on " << n_in_done
              << " FSTs, produced " <<  n_out_done << " FSTs";
    return (n_out_done != 0 ? 0 : 1);
  } catch(const std::exception &e) {
    std::cerr << e.what();
    return -1;
  }
}