>>148
報告ありがとうやで
実は作者は学習が進む所までしか動作検証していない(lora作成)
なので該当機能を初めて正しく使ったのは148という事になるぞ

一応、DPO実装前のADDifT学習自体はlora作成まではやった
DPOは通常ADDifTの学習時の計算アルゴリズム処理を変えただけらしい
だから既存コードの大部分をそのまま使える

マイナスで動作は内部で画像AとBが逆扱いになったからかもしれん
コード確認して問題が見つかったら修正しようと思う
通常ADDifTは画像を交差使用に対してDPOは固定化したからそこでやらかしたかも?