import gtn
import math
import numpy as np
import nb_utils
nb_utils.init()


symbols = {0: "a", 1: "b", 2: "c"}

# Encode the string "aaabaa" as integer ids:
x = [0, 0, 0, 1, 0, 0]  
g = gtn.Graph()
g.add_node(start=True)
for i, l in enumerate(x):
    g.add_node(accept=(i + 1==len(x)))
    g.add_arc(src_node=i, dst_node=i + 1, label=l)
gtn.draw(g, "figures/ngram_string.svg", isymbols=symbols)

# Make the bigram matching graph for "aa":
bigram = gtn.Graph()
bigram.add_node(start=True)
bigram.add_node()
bigram.add_node(accept=True)
bigram.add_arc(src_node=0, dst_node=1, label=0)
bigram.add_arc(src_node=1, dst_node=2, label=0)
for l in range(len(symbols)):
    bigram.add_arc(src_node=0, dst_node=0, label=l)
    bigram.add_arc(src_node=2, dst_node=2, label=l)


bigram_paths = gtn.intersect(g, bigram)
gtn.draw(bigram_paths, "figures/bigram_paths.svg", isymbols=symbols)


s = gtn.forward_score(bigram_paths)
p = math.exp(s.item())
print(f"The number of occurrences of 'ab' in 'aaabaa' is {p:.0f}")

The number of occurrences of 'ab' in 'aaabaa' is 3


edits = gtn.Graph()
edits.add_node(True)
edits.add_node(accept=True)
edits.add_node(accept=True)
edits.add_node(accept=True)
edits.add_node(accept=True)
edits.add_arc(
    src_node=0, dst_node=1, ilabel=gtn.epsilon, olabel=0, weight=1)
edits.add_arc(
    src_node=0, dst_node=1, ilabel=gtn.epsilon, olabel=1, weight=1)
edits.add_arc(
    src_node=0, dst_node=2, ilabel=0, olabel=gtn.epsilon, weight=1)
edits.add_arc(
    src_node=0, dst_node=2, ilabel=1, olabel=gtn.epsilon, weight=1)
edits.add_arc(
    src_node=0, dst_node=3, ilabel=0, olabel=1, weight=1)
edits.add_arc(src_node=0, dst_node=3, ilabel=1, olabel=0, weight=1)
edits.add_arc(src_node=0, dst_node=4, label=0)
edits.add_arc(src_node=0, dst_node=4, label=1)
gtn.draw(edits, "figures/edits.svg", isymbols=symbols, osymbols=symbols)


# Construct the closure of the edits graph:
edits = gtn.Graph()
edits.add_node(start=True, accept=True)
edits.add_arc(0, 0, gtn.epsilon, 0, -1)
edits.add_arc(0, 0, gtn.epsilon, 1, -1)
edits.add_arc(0, 0, 0, gtn.epsilon, -1)
edits.add_arc(0, 0, 1, gtn.epsilon, -1)
edits.add_arc(0, 0, 0, 1, -1)
edits.add_arc(0, 0, 1, 0, -1)
edits.add_arc(0, 0, 0, 0)
edits.add_arc(0, 0, 1, 1)

# Construct a graph representing "aba":
X = gtn.Graph()
X.add_node(start=True)
X.add_node()
X.add_node()
X.add_node(accept=True)
X.add_arc(0, 1, 0)
X.add_arc(1, 2, 1)
X.add_arc(2, 3, 0)

# Construct a graph representing "aabb":
Y = gtn.Graph()
Y.add_node(start=True)
Y.add_node()
Y.add_node()
Y.add_node()
Y.add_node(accept=True)
Y.add_arc(0, 1, 0)
Y.add_arc(1, 2, 0)
Y.add_arc(2, 3, 1)
Y.add_arc(3, 4, 1);

3


edit_paths = gtn.compose(X, gtn.compose(edits, Y))
gtn.draw(edit_paths, "figures/edit_paths.svg", isymbols=symbols, osymbols=symbols)


# The edit distance is the negation of the Viterbi score
edit_distance = -gtn.viterbi_score(edit_paths).item()
edit_path = gtn.viterbi_path(edit_paths)
gtn.draw(edit_path, "figures/edit_path.svg", isymbols=symbols, osymbols=symbols)


# The unigram graph U:
U = gtn.Graph()
U.add_node(start=True, accept=True)
U.add_arc(src_node=0, dst_node=0, label=0)
U.add_arc(src_node=0, dst_node=0, label=1)
U.add_arc(src_node=0, dst_node=0, label=2)
U.set_weights([math.log(p) for p in [0.5, 0.2, 0.3]])

# The graph representing the sequence "aa":
X = gtn.Graph()
X.add_node(start=True)
X.add_node()
X.add_node(accept=True)
X.add_arc(src_node=0, dst_node=1, label=0)
X.add_arc(src_node=1, dst_node=2, label=0)

# Compute the unigram probability of "aa":
x_scored = gtn.intersect(X, U)
x_prob = math.exp(gtn.forward_score(x_scored).item())
print(f"The unigram probability of aa is {x_prob:.3f}")
gtn.draw(x_scored, "figures/unigram_aa_scored.svg", isymbols=symbols)

The unigram probability of aa is 0.250


# Construct the emisisons graph with randomly sampled 
# emissions scores, s_t():
E = gtn.linear_graph(4, 3)
E.set_weights(np.random.randn(4*3).round(decimals=1))
gtn.draw(E, "figures/asg_emissions.svg", isymbols=symbols)


Ay = gtn.Graph()
Ay.add_node(start=True)
Ay.add_node()
Ay.add_node(accept=True)
Ay.add_arc(src_node=0, dst_node=0, label=0)
Ay.add_arc(src_node=0, dst_node=1, label=0)
Ay.add_arc(src_node=1, dst_node=1, label=1)
Ay.add_arc(src_node=1, dst_node=2, label=1)
gtn.draw(Ay, "figures/asg_alignments.svg", isymbols=symbols)


AXy = gtn.intersect(Ay, E)
gtn.draw(AXy, "figures/asg_constrained.svg", isymbols=symbols)


def ASG(E, B, Ay):
    # Compute constrained and normalization graphs:
    AXy = gtn.intersect(gtn.intersect(B, Ay), E)
    ZX = gtn.intersect(B, E)
    
    # Forward both graphs:
    AXy_score = gtn.forward_score(AXy)
    ZX_score = gtn.forward_score(ZX)
    
    # Compute the loss:
    loss = gtn.negate(gtn.subtract(AXy_score, ZX_score))
    
    # Clear the previous gradients:
    E.zero_grad()
    B.zero_grad()
    
    # Compute gradients:
    gtn.backward(loss, retain_graph=False)

    return loss.item()

# Make the bigram transition graph for the token set
# {a, b, c} with gradient computation enabled:
B = gtn.Graph(calc_grad=True)
B.add_node(start=True, accept=True)
B.add_node(accept=True)
B.add_node(accept=True)
B.add_node(accept=True)
for i in range(4):
    for j in range(3):
        B.add_arc(src_node=i, dst_node=(j + 1), label=j)
        
# Call the ASG loss:
loss = ASG(E, B, Ay)
print(f"The ASG loss is {loss:.3f}.")

# Access the graph containing the gradient for B:
dB = B.grad()

The ASG loss is 3.669.


Y = gtn.Graph()
Y.add_node(start=True)
Y.add_node()
Y.add_node(accept=True)
Y.add_arc(0, 1, label=0)
Y.add_arc(1, 2, label=1)
gtn.draw(Y, "figures/asg_target_ab.svg", isymbols=symbols, osymbols=symbols)


Ta = gtn.Graph()
Ta.add_node(start=True)
Ta.add_node(accept=True)
Ta.add_arc(src_node=0, dst_node=1, label=0)
Ta.add_arc(src_node=1, dst_node=1, ilabel=0, olabel=gtn.epsilon)

gtn.draw(Ta, "figures/asg_tokens_a.svg", isymbols=symbols, osymbols=symbols)


def make_token_graph(label):
    """Make an individual ASG token graph for the given label."""
    T_l = gtn.Graph()
    T_l.add_node(start=True)
    T_l.add_node(accept=True)
    T_l.add_arc(src_node=0, dst_node=1, label=label)
    T_l.add_arc(src_node=1, dst_node=1, ilabel=label, olabel=gtn.epsilon)
    return T_l

# Make the complete token graph:
T = gtn.closure(gtn.union([make_token_graph(l) for l in range(3)]))
gtn.draw(T, "figures/asg_tokens.svg", isymbols=symbols, osymbols=symbols)


Ay2 = gtn.compose(T, Y)
# Clean-up AY by removing superfluous ϵ transitions
# and converting it from a transducer to an acceptor
# using the input labels:
Ay2 = gtn.project_input(gtn.remove(Ay2))

equiv = gtn.rand_equivalent(Ay, Ay2, num_samples=100)
print(f"Equivalence check: {equiv}")

Equivalence check: True


# Add the blank token to the symbol set
symbols[3] = "<b>"

# Construct the CTC alignment graph for "ab":
Ay = gtn.Graph()
Ay.add_node(start=True)
Ay.add_node()
Ay.add_node()
Ay.add_node(accept=True)
Ay.add_node(accept=True)
Ay.add_arc(src_node=0, dst_node=0, label=3)
Ay.add_arc(src_node=0, dst_node=1, label=0)
Ay.add_arc(src_node=1, dst_node=1, label=0)
Ay.add_arc(src_node=1, dst_node=2, label=3)
Ay.add_arc(src_node=1, dst_node=3, label=1)
Ay.add_arc(src_node=2, dst_node=2, label=3)
Ay.add_arc(src_node=2, dst_node=3, label=1)
Ay.add_arc(src_node=3, dst_node=3, label=1)
Ay.add_arc(src_node=3, dst_node=4, label=3)
Ay.add_arc(src_node=4, dst_node=4, label=3)
gtn.draw(Ay, "figures/ctc_alignments.svg", isymbols=symbols)


# Construct the CTC alignment graph for "aa":
Ay_aa = gtn.Graph()
Ay_aa.add_node(start=True)
Ay_aa.add_node()
Ay_aa.add_node()
Ay_aa.add_node(accept=True)
Ay_aa.add_node(accept=True)
Ay_aa.add_arc(src_node=0, dst_node=0, label=3)
Ay_aa.add_arc(src_node=0, dst_node=1, label=0)
Ay_aa.add_arc(src_node=1, dst_node=1, label=0)
Ay_aa.add_arc(src_node=1, dst_node=2, label=3)
Ay_aa.add_arc(src_node=2, dst_node=2, label=3)
Ay_aa.add_arc(src_node=2, dst_node=3, label=0)
Ay_aa.add_arc(src_node=3, dst_node=3, label=0)
Ay_aa.add_arc(src_node=3, dst_node=4, label=3)
Ay_aa.add_arc(src_node=4, dst_node=4, label=3)
gtn.draw(Ay_aa, "figures/ctc_alignments_aa.svg", isymbols=symbols)


blank_token = gtn.Graph()
blank_token.add_node(start=True, accept=True)
blank_token.add_arc(src_node=0, dst_node=0, ilabel=3, olabel=gtn.epsilon)

# Make the complete token graph:
tokens = [make_token_graph(l) for l in range(3)]
tokens.append(blank_token)
T = gtn.closure(gtn.union(tokens))

Ay2 = gtn.compose(T, Y)

# Clean-up and convert AY to an acceptor:
Ay2 = gtn.project_input(gtn.remove(Ay2))

# Compare the AY for ab generated by hand to the one computed
# from the token graph. They should be equivalent:
equiv = gtn.rand_equivalent(Ay, Ay2, num_samples=100)
print(f"Equivalence check: {equiv}")

Equivalence check: True

Extended Examples¶

Counting $n$-grams¶

Edit Distance¶

Example¶

$n$-gram Language Model ¶

Example ¶

Automatic Segmentation Criterion¶

Aside: Global or Local Normalization¶

Transitions¶

ASG with Transducers¶

Connectionist Temporal Classification¶

Example¶

CTC from Transducers¶

Extended Examples¶

Counting $n$-grams¶

Edit Distance¶

Example¶

$n$-gram Language Model¶

Example¶

Automatic Segmentation Criterion¶

Aside: Global or Local Normalization¶

Transitions¶

ASG with Transducers¶

Connectionist Temporal Classification¶

Example¶

CTC from Transducers¶

$n$-gram Language Model ¶

Example ¶