شاید کارتون راه افتاده باشه ولی یک راه جل ساده تر هم شاید باشه - البته خودم تست نکردم
محتوای هر دو فایل رو به صورت خط به خط داخل یک جدول تو دیتابیس ذخیره کنید و ستونی که این محتوا توش قرار میگیره رو هم unique قرار بدید اینطور اگر چیزی تکراری باشه فقط یکیش میره . بعد هه رو از دیتابیس بازخوانی کنید و در یک فایل دیگه ذخیره کنید تمام .
برای سوال دومتون هم جواب میده - از لحاظ تئوری که عملیه - کدش هم آسون هست فقط بلد باشید هر خط رو از هم جدا کنید دیگه بقیش شکلاته