mirror of
https://github.com/fumiama/go-docx.git
synced 2026-06-04 23:30:25 +08:00
add p.MergeText
This commit is contained in:
127
structtext.go
127
structtext.go
@@ -23,6 +23,7 @@ package docx
|
||||
import (
|
||||
"encoding/xml"
|
||||
"io"
|
||||
"reflect"
|
||||
)
|
||||
|
||||
// Tab is the literal tab
|
||||
@@ -70,3 +71,129 @@ func (r *Text) UnmarshalXML(d *xml.Decoder, start xml.StartElement) error {
|
||||
|
||||
return nil
|
||||
}
|
||||
|
||||
// RunMergeRule compares two runs and decides whether they can be merged
|
||||
type RunMergeRule func(r1, r2 *Run) bool
|
||||
|
||||
// MergeAllRuns ...
|
||||
func MergeAllRuns(r1, r2 *Run) bool {
|
||||
return true
|
||||
}
|
||||
|
||||
// MergeSamePropRuns merges runs with the same properties
|
||||
func MergeSamePropRuns(r1, r2 *Run) bool {
|
||||
if r1 == nil || r2 == nil {
|
||||
return false
|
||||
}
|
||||
if r1.RunProperties == r2.RunProperties {
|
||||
return true
|
||||
}
|
||||
if r1.RunProperties == nil && r2.RunProperties != nil {
|
||||
return false
|
||||
}
|
||||
if r1.RunProperties != nil && r2.RunProperties == nil {
|
||||
return false
|
||||
}
|
||||
rr1 := reflect.ValueOf(r1.RunProperties).Elem()
|
||||
rr2 := reflect.ValueOf(r2.RunProperties).Elem()
|
||||
for i := 1; i < rr1.NumField(); i++ {
|
||||
x1 := rr1.Field(i)
|
||||
x2 := rr2.Field(i)
|
||||
if x1.IsZero() && x2.IsZero() {
|
||||
continue
|
||||
}
|
||||
if x1.IsZero() && !x2.IsZero() {
|
||||
return false
|
||||
}
|
||||
if !x1.IsZero() && x2.IsZero() {
|
||||
return false
|
||||
}
|
||||
xx1 := x1.Elem()
|
||||
if xx1.NumField() <= 1 {
|
||||
continue
|
||||
}
|
||||
xx2 := x2.Elem()
|
||||
for j := 1; j < xx1.NumField(); j++ {
|
||||
if !xx1.Field(j).Equal(xx2.Field(j)) {
|
||||
return false
|
||||
}
|
||||
}
|
||||
}
|
||||
return true
|
||||
}
|
||||
|
||||
// MergeText will merge contiguous run texts in a paragraph into one run
|
||||
//
|
||||
// note: np is not a deep-copy
|
||||
func (p *Paragraph) MergeText(canmerge RunMergeRule) (np Paragraph) {
|
||||
var prevrun *Run
|
||||
np = *p
|
||||
np.Children = make([]interface{}, 0, 64)
|
||||
for _, c := range p.Children {
|
||||
switch o := c.(type) {
|
||||
case *Run:
|
||||
r := *o
|
||||
r.Children = make([]interface{}, 0, 16)
|
||||
t := &Text{}
|
||||
for _, c := range o.Children {
|
||||
switch x := c.(type) {
|
||||
case *Text:
|
||||
if x.Text != "" {
|
||||
t.Text += x.Text
|
||||
}
|
||||
default:
|
||||
if t.Text != "" {
|
||||
r.Children = append(r.Children, t)
|
||||
t = &Text{}
|
||||
}
|
||||
r.Children = append(r.Children, x)
|
||||
}
|
||||
}
|
||||
if t.Text != "" {
|
||||
r.Children = append(r.Children, t)
|
||||
}
|
||||
if prevrun != nil && canmerge(prevrun, &r) {
|
||||
var prevtext *Text
|
||||
noappend := false
|
||||
if len(prevrun.Children) == 0 {
|
||||
prevtext = &Text{}
|
||||
} else {
|
||||
i := len(prevrun.Children) - 1
|
||||
if t, ok := prevrun.Children[i].(*Text); ok {
|
||||
prevtext = t
|
||||
noappend = true
|
||||
} else {
|
||||
prevtext = &Text{}
|
||||
}
|
||||
}
|
||||
for _, c := range r.Children {
|
||||
switch x := c.(type) {
|
||||
case *Text:
|
||||
if x.Text != "" {
|
||||
prevtext.Text += x.Text
|
||||
}
|
||||
default:
|
||||
if prevtext.Text != "" {
|
||||
if noappend {
|
||||
noappend = false
|
||||
} else {
|
||||
prevrun.Children = append(prevrun.Children, t)
|
||||
}
|
||||
prevtext = &Text{}
|
||||
}
|
||||
prevrun.Children = append(prevrun.Children, x)
|
||||
}
|
||||
}
|
||||
if prevtext.Text != "" && !noappend {
|
||||
prevrun.Children = append(prevrun.Children, t)
|
||||
}
|
||||
} else {
|
||||
prevrun = &r
|
||||
np.Children = append(np.Children, &r)
|
||||
}
|
||||
default:
|
||||
np.Children = append(np.Children, o)
|
||||
}
|
||||
}
|
||||
return
|
||||
}
|
||||
|
||||
227
structtext_test.go
Normal file
227
structtext_test.go
Normal file
@@ -0,0 +1,227 @@
|
||||
package docx
|
||||
|
||||
import (
|
||||
"encoding/xml"
|
||||
"strings"
|
||||
"testing"
|
||||
)
|
||||
|
||||
const xml2merge = `<w:p w14:paraId="343EA723" w14:textId="17A5316C" w:rsidR="00B7252F" w:rsidRPr="00334290" w:rsidRDefault="00B7252F" w:rsidP="00334290">
|
||||
<w:pPr>
|
||||
<w:spacing w:after="120" w:line="240" w:lineRule="atLeast"/>
|
||||
<w:jc w:val="center"/>
|
||||
<w:rPr>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
</w:pPr>
|
||||
<w:r w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>某某某大学</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00DC7F59" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>20</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00F276CD" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>1</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00AC3815">
|
||||
<w:rPr>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>6</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00DC7F59" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>-20</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00F276CD" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>1</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00AC3815">
|
||||
<w:rPr>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>7</w:t>
|
||||
</w:r>
|
||||
<w:proofErr w:type="gramStart"/>
|
||||
<w:r w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>学年第</w:t>
|
||||
</w:r>
|
||||
<w:proofErr w:type="gramEnd"/>
|
||||
<w:r w:rsidR="007A75E1" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t xml:space="preserve"></w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00BA388C" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t>1</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t xml:space="preserve"></w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>学期期</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="007A75E1" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t xml:space="preserve"></w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="007A75E1" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t>末</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t xml:space="preserve"></w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="006B05F0" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>考试</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00DC7F59" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t xml:space="preserve"></w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00B75B37" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t>A</w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00DC7F59" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
<w:u w:val="single"/>
|
||||
</w:rPr>
|
||||
<w:t xml:space="preserve"></w:t>
|
||||
</w:r>
|
||||
<w:r w:rsidR="00DC7F59" w:rsidRPr="00027D88">
|
||||
<w:rPr>
|
||||
<w:rFonts w:hint="eastAsia"/>
|
||||
<w:b/>
|
||||
<w:sz w:val="28"/>
|
||||
</w:rPr>
|
||||
<w:t>卷</w:t>
|
||||
</w:r>
|
||||
</w:p>`
|
||||
|
||||
const (
|
||||
allmergedtext = `某某某大学2016-2017学年第1学期期末考试A卷`
|
||||
propmergedtext = `某某某大学201|6|-201|7|学年第|1|学期期|末|考试||A||卷|`
|
||||
)
|
||||
|
||||
func TestMergeText(t *testing.T) {
|
||||
p := Paragraph{}
|
||||
err := xml.Unmarshal(StringToBytes(xml2merge), &p)
|
||||
if err != nil {
|
||||
t.Fatal(err)
|
||||
}
|
||||
np := p.MergeText(MergeAllRuns)
|
||||
if len(np.Children) != 1 {
|
||||
t.Fatal("expected only one run but has", len(np.Children))
|
||||
}
|
||||
if len(np.Children[0].(*Run).Children) != 1 {
|
||||
t.Fatal("expected only one run.child but has", len(np.Children[0].(*Run).Children))
|
||||
}
|
||||
if np.Children[0].(*Run).Children[0].(*Text).Text != allmergedtext {
|
||||
t.Fatal("expected merged text [", allmergedtext, "] but has [", np.Children[0].(*Run).Children[0].(*Text).Text, "]")
|
||||
}
|
||||
np = p.MergeText(MergeSamePropRuns)
|
||||
if len(np.Children) != 13 {
|
||||
t.Fatal("expected 13 runs but has", len(np.Children))
|
||||
}
|
||||
sb := strings.Builder{}
|
||||
for _, r := range np.Children {
|
||||
if len(r.(*Run).Children) > 1 {
|
||||
t.Fatal("expected 0/1 run.child but has", len(r.(*Run).Children))
|
||||
}
|
||||
if len(r.(*Run).Children) == 1 {
|
||||
sb.WriteString(r.(*Run).Children[0].(*Text).Text)
|
||||
}
|
||||
sb.WriteString("|")
|
||||
}
|
||||
if sb.String() != propmergedtext {
|
||||
t.Fatal("expected merged text [", propmergedtext, "] but has [", sb.String(), "]")
|
||||
}
|
||||
}
|
||||
Reference in New Issue
Block a user